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Avant-propos 


— Deux ans! dit Dantès, vous croyez que je 
pourrais apprendre toutes ces choses en deux 
ans ? 

- Dans leur application, non; dans leurs prin- 
cipes, oui : apprendre n’est pas savoir ; il y a les 
sachants et les savants : c’est la mémoire qui fait 
les uns, c'est la philosophie qui fait les autres. 
Dantès avait une mémoire prodigieuse, une fa- 
cilité de conception extrême : la disposition 
mathématique de son esprit le rendait apte à 
tout comprendre par le calcul, tandis que la 
poésie du marin corrigeait tout ce que pouvait 
avoir de trop matériel la démonstration réduite 
à la sécheresse des chiffres ou à la rectitude des 
lignes. 


Alexandre Dumas, Le comte de Monte-Cristo 


Edmond Dantès, le héros du roman d’Alexandre Dumas, 
dispose de deux ans pour apprendre les mathématiques, la 
physique, l’histoire, et «trois ou quatre langues vivantes », à 
l'insu des gardiens de sa prison. Votre tâche est plus abordable : 
si en un an vous venez à bout du présent ouvrage, vous aurez 
couvert les programmes d'analyse et d'algèbre de première an- 
née post-baccalauréat. 

Certains étudiants se contenteront, selon leur filière, d’une 
sélection de quelques chapitres. Par exemple l’auteur a ensei- 
gné à des élèves chimistes, parcourant au premier semestre les 
chapitres 3, 4, 6, et le tout début des 8, 9 et 10, alors que le 
deuxième semestre, dédié à l'algèbre, s’est construit autour des 
chapitres 12, 13, 14, 15 et 16 (quelques morceaux choisis de la 
partie « Préliminaires » étant disséminés au fur et à mesure des 
besoins). À l'inverse, d’autres élèves amenés à étudier plus de 
mathématiques en première année, comme par exemple ceux 
en classes préparatoires, exploreront tous les chapitres et dé- 
tailleront même les encadrés « hors programme ». Les ensei- 
gnants infléchiront, par le choix des exercices supplémentaires 
qu'ils voudront bien proposer, votre course à travers l'analyse 
et l'algèbre. 


Le parti pris de ce cours 


L'idée de ce « cours concis » est de proposer, aux étudiants 
comme aux enseignants, un cours de mathématiques essentiel- 
lement identique à ce que l’auteur produirait au tableau. (On 
a bien sûr incorporé dans le texte les nombreuses remarques 
orales qui accompagneraient un tel cours.) Afin de tendre vers 
cet objectif, on a déshabillé ce livre du caractère encyclopé- 
dique dont est empreinte la majorité des ouvrages de mathé- 
matiques à l'attention des élèves de première année. 

Vous pourrez d’ailleurs, si telle est votre préférence, faire 
une utilisation complémentaire de ce cours et d’un ou plu- 
sieurs ouvrages à vocation exhaustive. 


Les exercices 


Tout au long des chapitres, vous êtes invités à résoudre un 
certain nombre d'exercices. Toutefois, les énoncés de ceux-ci ne 
sont pas inclus dans le livre. Ils sont à retrouver sur le site In- 
ternet « exo7 », qui (au moment où cet avant-propos est rédigé, 
en mai 2013) se trouve à l'adresse suivante : 


http://exo7.emath.fr/search.php 


Vous y trouverez un très grand nombre d'exercices supplé- 
mentaires, dont une bonne partie comprend une correction, et 
parfois même une correction filmée. Sur la page personnelle de 
l’auteur, que vous trouverez aisément à l’aide d’un moteur de 
recherche, vous pourrez également télécharger les exercices au 
format PDF, ainsi qu’une version gratuite de ce livre. 

Dans le texte, les numéros des exercices sont donnés dans 
la marge. Ils peuvent être reportés directement dans le « cadre 
de saisie » d’exo7. 

Précisons une chose. La sélection des exercices que nous 
avons opérée est orientée vers la compréhension des concepts 
les plus basiques ; à de très rares exceptions près, les problèmes 
à résoudre ne font pas appel à des astuces. Le but est de vous 
assurer de votre bonne progression dans le cours, avec ce ba- 
romètre simple : vous devez être capable de faire tous les exer- 
cices ou presque. 

Les exercices plus « astucieux », qui peuvent très bien être 
au goût de l’auteur par ailleurs, vous seront proposés par vos 
enseignants. 


Les deux lectures 


Un certains nombre de découpages ont été faits, dans le but 
de séparer les choses les plus faciles des choses les plus ardues. 
Les encadrés, on l’a dit, contiennent des informations officiel- 
lement « hors programme ». Mais vous constaterez également 
que la plupart des chapitres se partagent entre une « première 
lecture » et une « deuxième lecture ». La deuxième lecture ren- 
ferme parfois les démonstrations de certains résultats annon- 
cés dans la première; parfois on y aborde d’autres concepts 
plus avancés. 

Précisons qu'on attend d’un élève de première année en 
filière mathématique à l’université qu'il connaisse le contenu 
des « deuxièmes lectures » (et les enseignants en deuxième an- 
née supposeront que c’est le cas). À l'extrême inverse, nous 
recommandons aux étudiants « pressés » (pour désigner ainsi 
ceux qui entament le travail à quelques jours de l’examen) de 
commencer par les premières lectures de tous les chapitres 
(plutôt que de lire quelques chapitres en entier). 

Notons que l’on peut effectivement se contenter de la pre- 
mière lecture et passer aux chapitres suivants. Il y aura très 
peu de références ultérieures aux théorèmes des deuxièmes lec- 
tures; et même dans les rares cas où on le fait, on peut facile- 
ment remettre à plus tard la lecture détaillée du passage indi- 
qué. Ceci permet de naviguer un peu dans les chapitres, même 
si par nature les mathématiques, à l’heure où on les découvre 
pour la première fois, permettent peu d'exercer cette liberté. 


À savoir avant de commencer 


On vous a peut-être dit, ou vous vous êtes peut-être ima- 
giné, que les mathématiques à partir de l’université repartaient 
de zéro, et redéfinissaient tous les concepts utilisés. C’est à la 
fois vrai d’un point de vue strictement logique, et chargé d’une 
certaine hypocrisie. 

Il est indéniable qu’une exposition préalable à des ma- 
thématiques va s'avérer indispensable à la bonne compréhen- 
sion de ce qui suit. Pour prendre quelques exemples, nous ne 
prendrons pas le temps ici de forger l'intuition selon laquelle 
deux nombres réels repèrent un point dans le plan, pas plus 
que nous n’aurons le loisir de dessiner de nombreux vecteurs 
comme des flèches et de les additionner en construisant des 
parallélogrammes. Nous mentionnerons ces choses, mais à un 
rythme qui n’est raisonnable que parce que l’on vous sait déjà 
à l'aise avec ces concepts. 

Une certaine familiarité avec le calcul est également atten- 
due. Pensez que nous allons définir le concept de dérivée, dont 
vous devez avoir une connaissance informelle depuis le lycée, 
et que nous allons enfin démontrer que les fonctions ayant une 
dérivée positive sont croissantes ; mais apprendre à calculer les 
dérivées est une gymnastique à laquelle on vous suppose un 
peu aguerris. 

Nous avons rassemblé dans un appendice, à la fin de la par- 
tie « Préliminaires », une compilation des connaissances de Ter- 
minale qui vont être les plus utiles à la lecture du présent ma- 
nuel. 
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Première partie 


Préliminaires 


Chapitre 1 


Ensembles 


Notre exploration des mathématiques commence par 
l’étude des ensembles, à partir desquels tout va être défini. 

Attention, il n'est pas garanti que la meilleure chose à faire 
soit de commencer par ce chapitre, pour certains étudiants : si 
vous en ressentez le besoin, attaquez plutôt par l’appendice A, 
qui résume les résultats du lycée que nous supposons connus. 


ENSEMBLES ET APPARTENANCE 
E 


Les objets mathématiques peuvent être rangés dans des en- 
sembles, que l'on écrit avec des accolades. Par exemple, 


E={1,2,3} et F=(19,11) 


sont des ensembles. On note x € X pour signifier que x appar- 
tient à X, et dans le cas contraire on emploie le symbole ¢ ; par 
exemple, on a 2 € E et 3 € F. 

Un ensemble ne comprend jamais de « répétitions », et n'est 
pas ordonné : ainsi 


{2,2,2,3,3}= {2,3} et {3,2,1}= {1,2,3}. 


Il existe bien sûr des ensembles infinis, comme l’ensemble N 
des nombres entiers, dont nous reparlerons au chapitre sui- 
vant. Il y a également un ensemble vide, qui ne contient aucun 
élément : on le note Ü ou, plus rarement, {}. 

Lorsque tous les éléments d’un ensemble A sont aussi dans 
l’ensemble B, on dit que A est une partie de B, ou qu'il est inclus 
dans B, et on note A C B. Par exemple 


{2,4,6,8} c {1,2,3,4,5,6,7,8,9}. 


Les ensembles sont souvent dessinés comme des bulles, et pour 
représenter l'inclusion on place ces bulles les unes dans les 
autres, comme ci-dessous : 


Fixant B, on peut considérer l’ensemble P(B) dont les élé- 
ments sont toutes les parties de B; ainsi dans le cas où B = 
{1,2,3},on a 


P(B) = (0,41), (2), (3), 41, 2), (1,3), (2,3), (1, 2,3) - 


(On n'oublie ni la partie vide, ni B lui-même.) 

Enfin, étant donnés deux ensembles A et B, on peut for- 
mer leur produit cartésien noté A x B, dont les éléments sont les 
paires (a, b) avec a € A et b € B. Lorsque A = {1,3} et B={2,4,6} 
par exemple, on a 


A x B = [(1,2), (1,4), (1,6), (3,2), (3,4), (3,6)). 


On notera que pour les paires, l'ordre est important : ainsi l'élé- 
ment (1,2) de N x N est différent de l'élément (2,1). 

On écrit volontiers A? au lieu de A x A. Sur le même mo- 
dèle on peut considérer, pour tout entier n > 1, l'ensemble 
noté A” dont les éléments sont de la forme (4,,4,...,4,) avec 
chaque a; € A (on parle des « n-uplets d'éléments de A », et 


pour n = 3,4,5 on parle de triplets, quadruplets, quintuplets). 


voir les exercices 
143, 130 


QUELQUES CONSTRUCTIONS 


Lorsqu'on dispose d’un ensemble E, on peut s'intéresser 
aux élements de E qui vérifient une certaine propriété P. Ceux- 
ci forment à nouveau un ensemble, que l’on note ainsi : 


(x € E | P(x)j. 


(Parfois le | est remplacé par deux points, ou par l'expression 
complète « tels que ». Il y a de nombreuses variantes et il faut 
s'habituer à des notations qui changent de temps en temps, en 
général pour éviter les lourdeurs.) 

Par exemple, supposons que A C E. Alors le complémentaire 
de A dans E est par définition 


(xe E|xeAj). 


On le note généralement E - A ou E x A, parfois même CA 
lorsque E est sous-entendu. 

Autre exemple, si A et B sont deux parties de E, alors leur 
intersection est 


ANB=(xeEE|xeAetxeBj, 
leur union est 


AUB={xeE|xeAouxeB}. 


EXEMPLE 1.1 — Prenons E = N x N, puis 
A={(n,m EeNxN|n=0}, 


et enfin 
B={(n,m eNxN|m=0}. 


Alors A NB = {(0,0)}. On peut également écrire 
AUB={(n,m EeNxN]nm= O0}. 


Note : en pratique, on écrirait plutôt A = {(0,m) € N x N} 
ou encore À = {(0, m) | m e N], l'essentiel étant de se faire 
comprendre. 


Il est très important de comprendre dès maintenant que la 
lettre x qui est employée ci-dessus dans la description des en- 
sembles peut être remplacée par n'importe quelle autre : on 
obtient rigoureusement les mêmes ensembles. Par exemple si 


A = (x e N | il existe y € N tel que x = 2y}, 


et si 
B = fa € N | il existe b € N tel que a = 2b}, 


alors A = B = les nombres entiers pairs. 


voir les exercices 
126,127, 133; 
135, 138,141, 
125 


PROPOSITIONS MATHÉMATIQUES 
EEE 


On ne peut pas utiliser tout et n'importe quoi pour décrire 
les ensembles. Pour se convaincre que les propriétés P comme 
ci-dessus ne peuvent pas être complètement arbitraires, voir 
l’encadré « Deux paradoxes ». Pour bien faire les choses, il 
conviendrait de définir précisément quelles sont les propriétés 
acceptables, ou en d’autres termes, définir ce qu'est un «énoncé 
mathématique ». 


Cette théorie existe, et il existe même plusieurs systèmes 
concurrents. Cependant il serait complètement hors de pro- 
pos de donner une description précise de l’un de ces systèmes 
dès maintenant (les détails sont parfois donnés en troisième ou 
quatrième année, et encore). Nous allons nous contenter d’une 
discussion informelle qui suit les grandes lignes de ce que l’on 
appelle la logique du premier ordre (pour des raisons que l’on 
n’expliquera pas). 

Nous avons rencontré des propositions mathématiques : 
x € À par exemple, et on pourrait citer aussi les égalités comme 
x = y. La négation d’une proposition en est une, ainsi x ¢ A est 
un énoncé mathématique. 

On peut créer de nouveaux énoncés à l’aide de « ou » et de 
«et» : nous l'avons fait dans la définition des intersections et 
des unions. On peut aussi relier deux énoncés P et Q par le 
symbole >, qui se lit «implique ». On obtient l'énoncé P = Q, 
qui est faux lorsque P est vrai et Q est faux ; dans tous les autres 
cas P => Q est vrai. Voyons un exemple : 


AZ={(xv)ENXN|xZ40 = y= 0}. 


Les éléments de A sont les paires (x, 0) avec x entier, ainsi que 
les paires (0,y) avec y entier. 

Le symbole = est surtout pertinent lorsqu'on l'utilise en 
conjonction avec le quantificateur universel, c'est-à-dire le petit 
symbole Y qui signifie « pour tout ». Nous pouvons par exemple 
utiliser ce symbole pour montrer que A C B est un énoncé ma- 
thématique : en effet il revient à dire 


Vx,xeA=xepB. 


L'autre quantificateur à notre disposition est le quantifica- 
teur existentiel, qui s'écrit 1 et signifie « il existe ». On a déjà ob- 
servé que, pour un nombre entier n, la propriété « n est pair » 
s'écrit 

Jm e N tel que n = 2m. 
(En toute rigueur, en logique du premier ordre on écrit plu- 
tôt 1m, m € N et n = 2m. On s'autorise un peu de souplesse 
pour plus de clarté.) 

En règle générale, un « énoncé mathématique » est une 
phrase que l'on peut réduire à une suite de symboles combi- 
nant V, 4, €, =, =, des négations, des « ou » et des «et ». En 
pratique cependant, la moindre définition, le moindre théo- 
rème, occuperaient des milliers de symboles si on voulait les 
décortiquer complètement. En conséquence, il faut veiller en 
permanence à ce que les énoncés que l’on produit soient théori- 
quement remplaçables par des symboles, sans jamais effectuer 
concrètement ce remplacement. Notons tout de même qu’à 
l’aide d’un ordinateur, on peut parfois rédiger certaines dé- 
monstrations jusqu’au moindre détail : c'est ce qu’on appelle 
les « preuves certifiées ». 

Ajoutons enfin que dans certaines situations, nous utili- 
serons les symboles Y, 4 ou autres, lorsque l’on souhaite le- 
ver toute ambigüité. Ainsi de la définition des limites, par 
exemple. 


voir les exercices 
T0: 142 


FONCTIONS 
| 


Étant donnés deux ensembles A et B, une fonction f de A 
vers B associe à tout élément x € A un élément f(x) € B et 
un seul. On peut traduire cette définition (un peu vague) en 
termes d'ensembles. Si l’on souhaite être extrêmement précis, 
on dira : 


DériniTioN 1.2 - Une fonction, ou application, est un objet f dé- 
terminé par trois ensembles : 


1. un ensemble A, appelé le domaine de définition de f, ou 
parfois la source de f ; 


2. un ensemble B, appelé le but de f ; 


3. un ensemble T, qui est une partie de A x B et que l’on 
appelle le graphe de f, ayant la propriété suivante : pour 
chaque x € A, il existe un unique y € B tel que (x,y) ET. 
Ce y est noté f(x). 


On utilise la notation 

f:A—B 
pour indiquer que f est une fonction dont le domaine de défi- 
nition est A et dont le but est B. 


On représente typiquement une fonction A > B de la ma- 
nière suivante : 


Chaque flèche sur ce dessin part d’un élément x € A et pointe 
sur f(x). La caractéristique importante est que chaque point 
de A marque le début d’une flèche, et d’une seule. 

Voyons quelques exemples. 


ExEMPLE 1.3 - Il y a une (et une seule) fonction f: N => N 
telle que f (n) = 2n? +1. On utilise parfois la notation 


f:N => N 
n => 2n2+1 


pour désigner cette fonction. C'est très souvent par des for- 
mules, telles que 2n? +1, que l'on va définir les fonctions. 

Ici le domaine de définition est A =N, le but est B =N, 
et le graphe de f est Ï = {(n,2n? +1) | n € N}. 


ExEMPLE 1.4 -Soit p: N x {0} > N la fonction telle 
que p(n) = le n-ième nombre premier. Ainsi p(1) = 2, 
p(2) = 3, p(3) = 5, p(4) = 7 et ainsi de suite. Cette fonc- 
tion p est bien définie, même si on n’a pas utilisé de for- 
mule. (Cela dit, il en existe.) 


ExEeMPLE 1.5 - Nous allons anticiper un peu et supposer 
que vous connaissez un minimum l’ensemble R. On le re- 
présente par une droite, et R x R par un plan. Une fonc- 
tion A > B avec A C R et B C R est donnée par son graphe, 
qui ressemble de près ou de loin à une courbe dans le plan. 
Par exemple la figure suivante représente un tel graphe. 


La propriété caractéristique des graphes se voit bien sur 
le dessin. Si maintenant on fait subir une rotation à cette 
figure, obtient-on encore le graphe d’une fonction ? 


La réponse est visiblement non : pour le x indiqué, il y a 
deux couples (x, y.) et (x, y2) qui appartiennent à la courbe. 
Ce mest donc pas un graphe. On retiendra la traduction 
géométrique simple : lorsque A C R et B C R, une partie T 
de AxB est le graphe d’une fonction A — B si et seulement 
si chaque droite verticale d’équation x = a (avec a € A) 
coupe T exactement en un point. 

Dans la suite du chapitre nous allons étudier la pro- 
priété correspondante en utilisant cette fois des droites ho- 
rizontales. 


— Fin de la première lecture — 


voir l'exercice 
132 


FONCTIONS INJECTIVES 
Ma] 


DériniTION 1.6 — Soit f : A > B une fonction. Supposons que, 
pour tout choix de deux éléments distincts x, z x dans l’en- 
semble A, on ait également f (x1) # f (x2). On dit alors que f est 
injective, ou encore que f est une injection. 


Il existe bien des façons de reformuler ceci. Par exemple, 
f est injective si et seulement si l'égalité f(x1) = f(x) en- 
traîne x, = x2. Également, il est bon de noter que f est injective 
si et seulement si l'équation 


dont l’inconnue est x € A et qui comporte le paramètre b € B, 
possède au maximum une solution. 


ExEMPLE 1.7 - La fonction d : N > N définie par d(n) = 2n, 
est injective : en effet si 2x1 = 2x3, alors x, = x. L'équa- 
tion d(x) = b s'écrit 2x = b; elle a une solution x = L si b est 
pair, et aucune solution si b est impair. 


ExeMPLe 1.8 — La fonction c : Z > N définie par c(n) = n? 


west pas injective (ici Z est l’ensemble de tous les nombres 
entiers, positifs ou négatifs). En effet c(n) = c(=n), de sorte 
que l'équation c(x) = b, qui s'écrit x? = b, peut posséder 
deux solutions, comme par exemple 2 et —2 qui sont solu- 
tions pour b = 4. 


Voici comment on représente une fonction injective : 


Cette fois-ci, les flèches pointent toutes vers des éléments 
différents. 


ExEMPLE 1.9 — Revenons au cas particulier où f : A > B 
avec À et B des parties de R. L'équation f(x) = b pos- 
sède une solution x lorsque le graphe de f comporte un 
point (x, f(x)) qui est également sur la droite horizontale 
d’équation y = b. La condition pour que f soit injective 
est donc que les droites horizontales rencontrent le graphe 
de f en un point au maximum. 

Soit T le graphe de f. Faisons subir à ce graphe une 
symétrie par rapport à la droite d’équation y = x (cette 
symétrie envoie le point (x,y) sur (y,x)). On obtient un 
ensemble T”. Lorsque f est injective, ce I’ ne rencontre 
les droites verticales qu’en un point au plus. C'est-à-dire 
que T” est le graphe d’une fonction ! 

Cette discussion est illustrée sur la figure suivante. 


Soyons plus précis. Pour définir une fonction g dont le 
graphe serait T’, il lui faut un ensemble de définition et un 
but. Les points de T” sont ceux de la forme (f(x), x). Notons 
donc 

f(A)=(f(x)]|x€ AJ CB. 


(Nous reviendrons sur cette notation (abrégée) dans le 
paragraphe suivant.) Alors on peut définir une fonc- 
tion g : f(A) > A dont le graphe est T”. Concrètement, on 
a g(f(a)) = a, ce qui a un sens puisque f est injective. 
Cette fonction g est essentiellement ce qu'on appelle la 
réciproque de f, qui se note f !. Toutefois il nous reste un 
peu de vocabulaire à introduire avant de détailler ceci. 


FONCTIONS SURJECTIVES ET BIJECTIVES 
ET 


DÉFINITION 1.10 — Soit f : A > B une fonction. On note f(A), 
ou encore Im(f), l'ensemble 


{beB|1xEe A tel que b = f(x)}. 


(En plus concis f(A) = {f(x) | x € A}.) On dit que f(A) est 
l’image de A par f. 

Lorsque f(A) = B, on dit que f est surjective, ou encore 
que f est une surjection. 


Ainsi f est surjective lorsque l’équation f(x) = b possède au 
minimum une solution. 


ExeMmPLE 1.11 -La fonction f : N x N => N définie 
par f (n, m) = n+ m est surjective. En effet, si on se donne be 
N, alors f(b,0) = b. On a aussi f(0,b) = b, et même f(1,b- 
1) = b, de sorte que f est loin d'être injective, par contre. 


ExEmMPLE 1.12 - La fonction d : N => N telle que d(n) = 2n 
n'est pas surjective. En fait l'ensemble image d(N) est l'en- 
semble des nombres pairs. 


Voici la représentation typique d'une fonction surjective : 


Ici chaque élément de B est à l'extrémité d'au moins une flèche. 


DÉFINITION 1.13 - Lorsqu'une fonction est à la fois injective et 
surjective, on dit qu'elle est bijective, ou encore que c'est une 
bijection. 


Lorsque f : À — B est bijective, l'équation f(x) = b pos- 
sède une solution et une seule (comme précédemment, l'incon- 
nue est x et b est un paramètre). Cette solution est notée f~t (b). 

On obtient ainsi une fonction f~! : B > A, que l’on appelle 
la réciproque de f. On a alors: 


Proposition 1.14 - Lorsque f est bijective, la fonction f `! vérifie 
1. fl (f(a))= a pour ae A, 
2. f(f 1(b)) =b pour be B. 
Réciproquement si on a une paire de fonctions f: À > B 
et g: B — A telles que g(f(a)) = a pour a € A et f(g(b)) = b 


pour b e B, alors f est une bijection et g = f ``. 
Enfin, f `! est également une bijection lorsqu'elle existe, et 


(MESSE 


Démonstration. (1) Étant donné a, soit b = f (a); puisque f est 
injective a est le seul élément de A qui vérifie cette équation, 
et c’est cet élément que l’on note f-!(b). Donc a = f !(b) = 
FF (a). 

(2) C’est la définition même de f-!(b). 

Montrons la réciproque. Soient f et g comme dans la pro- 
position. Si f(41) = f (a2), alors on a aussi g(f(a1)) = g(f(a)), 
donc 4; = az. Ainsi f est injective. De plus, si b € B on a b = 
f(g(b)) donc b est bien dans l’image de f, ce qui montre que f 
est surjective. Finalement f est une bijection. 

Partant de f (f !(b)) = b = f (g(b)), on applique g pour obte- 


ef) = g[f(g(b))]. 


Puisque g(f(a)) = a pour tout a € A (et donc en particulier 
pour a = f -!(b) ou pour a = g(b)), cette dernière égalité se sim- 
plifie et donne f~! (b) = g(b). Donc f "=g. 

Par symétrie, on peut inverser les rôles de f et de g. Donc g 
est bijective et g7! = f, c’est-à-dire que f~! est bijective et 


que (f !)1=f. 


ExEMPLE 1.15 - La fonction s : Z — Z définie par s(n) = -n 


est une bijection. De plus, s! = s. 


voir les exercices 
187, 190, 201 


EXEMPLES DE BIJECTIONS 
MMMM 


Vous connaissez depuis le lycée quelques paires de bijec- 
tions réciproques : exponentielle et logarithme, cosinus et arc- 
cosinus, sinus et arcsinus, tangente et arctangente. Des rap- 
pels complets sont données dans l’appendice A, voir la partie 
« Fonctions usuelles » en page 140. 

Attardons-nous ici sur l'exemple très simple des fonctions 
« carré » et « racine carrée ». Plus précisément, la fonction 


f: [0,+œ[— [0, +00[ 


définie par f(x) = x? est une bijection. Sa réciproque f! s'ap- 
pelle la fonction « racine carrée » et se note f 1(x) = yx. 


Que sommes-nous capables de véritablement démontrer ? 
Commençons par l'injectivité de f. Si f(x1) = f(x2), on a x? = 
x3, d’où 

XÍ -x = (x1 — x2)(x1 +x2) =0. 
Or puisqu'on se restreint à xı > 0 et x, > 0, on ne peut avoir xı + 
x) = 0 que lorsque xı = x, = 0. Dans les autres cas, on simplifie 
par x; + x2 et on en conclut que x; = x2, là encore. Donc f est 
injective. 

La fonction f, dont le but est [0,+co[ est-elle bien surjec- 
tive? C’est une question bien plus difficile ! Il s’agit de savoir 
si tout nombre réel b > 0 possède « une racine carrée », c'est-à- 
dire s’il existe x tel que b = x?. En d’autres termes, est-ce qu’on 
peut toujours donner un sens à la notation Vb? Bien sûr nous 
venons d'affirmer ci-dessus que la réponse est oui, mais com- 
ment le démontrer ? 

C'est l’objet du chapitre suivant, et c’est aussi notre pre- 
mière rencontre avec un énoncé considéré comme évident jus- 
qu'au lycée et qu’il va falloir élucider. L'étude des « fonctions 
usuelles » en contient bien d’autres (qu'est-ce que l’exponen- 
tielle, au juste ? qu'est-ce qu’un cosinus ? etc.). 


QUELQUES OPÉRATIONS SUR LES FONCTIONS 


DÉFINITION 1.16 — Soit f : E > F et g: F — G deux fonctions. La 
composée de f et g, notée g o f, est la fonction E > G définie 


par g o f(x) = g(f(x)) pour x € E. 


ExEmMPLE 1.17 — Prenons E = F = G = R, puis f(x) =x+ 1 
et g(x) = x?. Alors go f(x) = x?+2x+1. 


Pour finir, nous allons maintenant donner un sens à f(A) 
lorsque A est une partie du domaine de définition de f, ainsi 
qu’à f_!(B) lorsque B est une partie du but de f. Attention, la 
notation f !(B) va prendre un sens même lorsque f n’est pas 
une bijection (et que la notation f`! toute seule n’a pas de sens). 
Plus précisément : 


DériniTioN 1.18 — Soit f : E > F une application. Pour A C E on 
note 
f(A)=([y EÉ F |y = f(x) pour un x € A] C F. 


Pour B c F, on définit 


ORR ANPE BIER 


ExemPLE 1.19 — Pour c: Z > N telle que c(n) = n?, 
on constate que c({1,2,3}) = {1,4,9}, et c-!({1,4,9}) = 
{-3,-2,-1,1,2,3}. (La fonction c! n'existe pas.) 


ExEMPLE 1.20 - Les ensembles de la forme f-!({}) pour y € 
F sont souvent appelés les fibres de f. Avec ce langage on 
énonce que f est surjective si et seulement si ses fibres sont 
toutes non-vides, et f est injective si et seulement si ses 
fibres ont au plus un élément. 

Lorsque f est bijective, et que la fonction f! existe, on 


a FHH = {F7 (p)}. 


voir les exercices 
185, 186, 193, 
194, 199, 124 


LA MÉTHODE AXIOMATIQUE 
[Á] 


Nous arrivons au terme de ce premier chapitre. Il reste une 
question difficile : avons-nous vraiment commencé par le com- 
mencement ? 

S'il existe une distinction essentielle entre les mathéma- 
tiques (en tout cas dans la vision idéalisée qu’on peut en avoir) 
et la plupart des autres disciplines, c'est sans doute qu'on y a 
tout le loisir de poser des questions. Qu'on essaie de deman- 
der à un physicien la définition d’une force, ou la définition de 
l'énergie (et non pas la formule qui calcule telle ou telle incar- 
nation de l'énergie), et on rencontrera rapidement des difficul- 
tés, qui sont profondes et inévitables. Richard Feynman dans 
son « Cours de Physique » donne une belle définition de l’éner- 
gie, par ailleurs très mathématique et sans doute décevante par 
certains égards pour les physiciens. Il ne parvient pas à en faire 
autant pour les forces, et il est intéressant de lire ses explica- 
tions. 

En théorie, ceci n'arrive jamais en mathématiques. Vous 
pouvez demander à votre professeur de définir ce qu'est le lo- 
garithme, il le fera (par exemple) en disant que c’est une in- 
tégrale ; vous pouvez demander ce qu'est une intégrale, vous 
aurez une réponse qui fait intervenir des limites; vous pou- 
vez ensuite demander ce que signifie un « passage à la limite », 
etc. Mais que va-t-il arriver lorsqu'on en finit par demander ce 
qu'est un ensemble, ce que sont les nombres entiers, et pour- 
quoi 2+ 2 = 4? Il va bien falloir trouver une réponse. 

Cependant, a-t-on vraiment le désir de traiter cette ques- 
tion maintenant, dans le premier chapitre d’un livre destiné 
aux étudiants en première année ? Nous affrontons un véritable 
dilemme. D'un côté, par simple honnêteté (et pas seulement 
pour avoir des réponses à disposition d’un étudiant qui aurait 
l’idée de demander la définition des choses « évidentes »), on 
a bien envie de commencer par le commencement, et de dé- 
finir tous les objets que l’on rencontre en partant « de rien ». 
D'un autre côté, on peut objecter que cette exigence serait aussi 
déraisonnable que d’imposer à chaque candidat au permis de 
conduire de connaître entièrement la mécanique automobile 
avant même sa première heure de conduite. 

De fait, la vaste majorité des mathématiciens de profession 
ne connaissent pas et ne souhaitent pas connaître les détails des 
fondements logiques des mathématiques. Ils en connaissent ce- 
pendant les grandes lignes, que nous allons exposer tout de 
suite. 

Le principe de départ de la « méthode axiomatique » est 
simple. On postule l'existence de certains objets, vérifiant cer- 
taines propriétés appelées axiomes. Par « postuler », il faut 
comprendre qu’il s’agit de se donner des règles du jeu, que 
l’on accepte sans les questionner. Ensuite, les résultats que l’on 
peut démontrer à partir de ces axiomes sont considérés comme 
«vrais dans la théorie ». 

Le premier exemple remonte à l'Antiquité, c'est celui des 
axiomes d’Euclide pour la géométrie. Euclide postule lexis- 
tence d'objets appelés points et droites (et d’autres encore), sa- 
chant qu’un point peut « appartenir » à une droite. Ceci dans 
le respect de certaines propriétés, comme « deux droites pa- 
rallèles à une même troisième sont parallèles » (et bien sür, 
dans cette théorie l'expression « être parallèles » est elle-même 
définie, à l’aide de concepts premiers comme l'appartenance 
d’un point à une droite). Toute la géométrie est déduite de ces 
axiomes. 

En principe, comme le disait Hilbert, on pourrait remplacer 
«point » par «table », « droite » par « chaise », et « appartenir » 
par n'importe quel verbe, et on pourrait toujours développer 
la théorie, de manière purement formelle. Ceci est vrai; ce ne 
sont que des mots. Toutefois, il faut se garder de prendre ceci 
trop au sérieux : les axiomes ont été choisis parce qu’Euclide a 
l'intuition que le monde réel comporte des points et des droites 
(ou au moins des segments), et parce qu’il souhaite considérer 
chaque résultat « vrai dans la théorie » comme une assertion 
vraie sur le monde réel. 

L'avantage de la méthode axiomatique est de couper court 
aux débats sur l'existence des objets de départ. On suppose 
qu'ils existent, vérifiant certaines propriétés, le reste n'est que 
déduction. Celui qui doute de l’existence de ces objets peut 
entrer dans un débat philosophique, par ailleurs intéressant, 
mais il ne peut pas critiquer le travail mathématique de ceux 
qui ont choisi ces axiomes (sauf à montrer que les axiomes 
sont contradictoires et que l’on peut en déduire des choses ab- 
surdes, comme un énoncé et son contraire simultanément, par 
exemple). 

On continue de nos jours à employer la méthode axio- 
matique, même si les mathématiques modernes ne reposent 
plus sur les axiomes d’Euclide. Il existe plusieurs systèmes 
d’axiomes possibles, et dans l'optique de ce livre il n’est ab- 
solument pas utile d'en comprendre les différences, ni même 
d'en décrire un en détail. Citons tout de même : 


1. Le système de l’arithmétique de Peano. On choisit ici de 
prendre les nombres entiers comme objets de départ, et 
on suppose qu'ils vérifient certaines propriétés comme 
«tout nombre n possède un successeur 1 +1 ». On déduit 
tout le reste. 


2. La théorie des ensembles de Zermelo & Fraenkel. Les objets 
de départ sont les ensembles et les axiomes sont, en gros, 
les propriétés décrites dans la première partie de ce cha- 
pitre. 


3. Il existe aussi un système qui part des fonctions comme 
objets primaires. 


Les théorèmes que l’on peut obtenir dans un système sont 
en général démontrables dans les autres systèmes. Ce n'est pas 
toujours vrai, et on obtient des résultats un peu plus forts avec 
la théorie des ensembles qu'avec l’arithmétique ; mais les dif- 
férences sont subtiles et nous n’en parlerons pas plus. Ceci si- 
gnifie qu'étant donné un système de départ, disons la théorie 
des ensembles, il faut pouvoir définir les objets des autres sys- 
tèmes, comme les nombres entiers ou les fonctions. 

Dans ce cours, on ne va pas s’encombrer de telles considé- 
rations, et nous considérerons comme « connus » aussi bien les 
ensembles que les nombres entiers. 


Richard 
Feynman, Le 
cours de 
Physique de 
Feynman, 
Dunod, 1999. 


Chapitre 2 


Nombres 


Dans ce chapitre nous allons faire connaissance avec les sys- 
tèmes de nombres N, Z, Q, R et C. Le plat de résistance est R, 
qui est d’ailleurs trop compliqué pour qu'on vous dise tout à 
son sujet ! Cependant nous allons mettre en valeur sa propriété 
essentielle, qui est celle de la « borne supérieure ». 

Dans la deuxième partie, qui relève plus de l’algèbre, nous 
décrivons quelques « nombres » plus originaux. 

Ce chapitre est destiné aux étudiants en filière mathéma- 
tique, et va moins intéresser les élèves chimistes ou ingénieurs, 
pour qui l'intuition que l’on a de R depuis le lycée devrait suf- 
fire. Si vous ne lisez pas ce chapitre, il y aura simplement dans 
la suite quelques démonstrations que vous ne pourrez pas com- 
prendre (en particulier celle de l'énoncé sur les suites crois- 
santes et majorées dans le chapitre « Suites », ou la construction 
de l'intégrale de Riemann dans le chapitre du même nom). 


LES PREMIERS NOMBRES 
MMMM 


Le premier ensemble de nombres à notre disposition est ce- 
lui des nombres naturels : 


N = [0,1,2,3,...). 


Puis vient l'ensemble des nombres relatifs Z, qui contient N, 
et comprend également les nombres négatifs comme -4. Enfin 
nous avons l'ensemble des nombres rationnels Q, c'est-à-dire 
l'ensemble des fractions E avec p,q € Z et q + 0. Noter les inclu- 
sions NC Z CQ. 

Dans le chapitre précédent nous avons expliqué que nous 
ne définirons pas l'ensemble N, considéré comme naturel (d’où 
son nom). Par contre on peut parfaitement donner une défini- 
tion des ensembles Z et Q à partir de N : voir l’encadré « Une 
définition de Q ». Quoi qu'il en soit, nous pouvons considérer 
que nous sommes à l'aise avec les nombres rationnels. 


A-t-on besoin d’autres nombres que des rationnels? C'est 
une question qui remonte aux Grecs de l’Antiquité. Les diffi- 
cultés apparaissent à peu près ainsi. Les nombres doivent au 
minimum être capables de mesurer les aires et les longueurs 
des objets qui nous entourent (c’est un petit anachronisme car 
les Grecs ne pensaient pas (encore) aux aires comme à des 
nombres, mais l’idée est la même). Imaginons donc un triangle 
rectangle et isocèle, dont le petit côté est de longueur 1, comme 
ci-dessous. 


1 


Le dessin suivant doit nous convaincre, si l’on sait que l'aire 
d’un rectangle s'obtient en multipliant les longueurs de ses cô- 
tés, que l'aire de notre triangle est i à 


1 


Maintenant, notons £ la longueur de l'hypoténuse (le grand 
côté du triangle), et considérons ce dernier dessin, obtenu à 
partir de 4 copies du triangle initial : 


L'aire du carré est £? ; manifestement, c'est 4 fois l'aire du 
triangle, donc 4 x 3 = 2. On doit donc avoir 


Fi 
C'est ici que les problèmes commencent : 


Proposition 2.1 — Il n'existe aucun nombre rationnel € € Q tel 
Gre G 2: 


Démonstration. Supposons par l'absurde que l'on ait £ = = tel 
que €? = 2, donc p? = 2q?. Quitte à simplifier la fraction un 
certain nombre de fois par 2, on peut supposer que p et q ne 
sont pas tous les deux pairs. 

Maintenant si l’on observe la relation p? = 2q?, on voit 
que p? est pair; donc p est pair également, ce que l’on va 
écrire p = 2r. Par suite p? = 4r? = 2q?, donc q? = 2r?. 

On en conclut que q? est pair, donc q aussi. C’est une contra- 
diction. 


Que faut-il en conclure ? Tout simplement que les nombres 
rationnels ne sont pas assez compétents pour décrire le monde 
réel. Pour être plus précis, si l’on veut assigner des nombres 
aux longueurs et aux aires, de sorte que certaines propriétés 
souhaitables soient satisfaites (par exemple en s’assurant que 
l'aire d’un rectangle est le produit des longueurs), alors on ne 
peut pas utiliser (seulement) les nombres rationnels. 


LES NOMBRES DÉCIMAUX ET LES RÉELS 
| 


Nous allons donner un survol de la construction de l’en- 
semble R des nombres réels. La discussion va rester un peu in- 
formelle et nous allons omettre un certain nombre de détails. 
Plus loin dans ce chapitre nous indiquerons de manière extré- 
mement précise comment on peut travailler avec R en ignorant 
ces détails. 

Commençons par rappeler l'écriture décimale, que vous 
connaissez depuis longtemps : il s’agit d'écrire par exemple 
572,413 pour 
4 1 3 
TO 100 1000 


Par ailleurs, bien sür, lorsqu'on écrit 572 c'est aussi un rac- 
courci pour 5 x 100 +7 x 10 + 2, et l'écriture décimale consiste 
simplement à autoriser les puissances négatives de 10, qui dé- 
marrent à partir de la virgule. 

Les nombres que l'on peut écrire ainsi sont appelés les 
nombres décimaux; notez qu’on dit parfois un « décimal » au 
lieu d’un « nombre décimal », et que d’autre part un nombre 
décimal comporte des chiffres décimaux (dans l'exemple ce sont 
5;7;2;4;1;3); enfin les chiffres décimaux après la virgule 
sont parfois appelés les « décimales » (au féminin) du nombre. 
Attention à tout ce vocabulaire ! 

Les nombres décimaux sont des éléments de Q, puisque, 
pour reprendre l'exemple, on a 572,413 = 372413, Par contre 
tous les éléments de Q ne sont pas des décimaux. Par exemple, 


montrons qu'on ne peut pas écrire } sous forme décimale : 


572 + 


en effet si c'était le cas, on pourrait écrire ł = 10 avec a € Z, 


d’où 10* = 3a. Or c’est absurde puisque 3 ne divise pas 10% = 
2K54 (nous reviendrons sur les questions de divisibilité plus 
loin dans ce livre ; si vous connaissez la règle qui affirme que les 
multiples de 3 ont la propriété que la somme de leurs chiffres 
est également un multiple de 3, alors vous voyez bien que ça 
ne marche pas pour 10° = 100...00 puisque la somme de ses 
chiffres est 1). Donc 3 n'est pas un nombre décimal. 

Voici une définition temporaire : l'ensemble R est l'en- 
semble des écritures décimales avec une infinité de chiffres dé- 
cimaux après la virgule. Donc un élément de R par définition 
est une écriture (symbolique) 


n, aj A4243... 


où n €Z et a; e {0,1,2,3,4,5,6,7,8,9} pour i > 1. 

Une difficulté immédiate apparaît. Imaginons savoir faire 
avec les éléments de R toutes les opérations usuelles d’ad- 
dition, de multiplication, etc, de sorte que les règles de cal- 
cul auxquelles nous sommes habitués soient valides (on vous 
laisse déterminer quelles règles on utilise dans l’argument ci- 
dessous). Nous allons faire alors une découverte étonnante en 
considérant le nombre 


x=0,9999999...€R. 
En effet on doit avoir 
10x = 9,999999... 


et donc 
9x = 10x- x = 9,0000... = 9. 


Finalement en divisant par 9 nous avons x = 1. Donc 
0,99999... =1. 


Deux écritures différentes peuvent donc représenter le même 
élément (et il va falloir changer la définition de R puisque 
0,999... n'est pas la même écriture symbolique que 1,000...). 
À y bien réfléchir, ça n'est pas plus surprenant que l'égalité 


1 5 


2 10 
nous avons déjà rencontré des écritures distinctes pour le 
même nombre. (Par ailleurs, si vous n'arrivez pas à convaincre 
quelqu'un que le nombre x est égal à 1, dites-lui que si on 
avait x < 1 alors on pourrait trouver y tel que x < y < 1, par 
exemple la moyenne y = = ; on se demande bien quelles se- 
raient alors les décimales de y!) 

Évidemment on obtient de la même manière des égalités 
similaires, comme 


1,25 = 1,2499999... 


par exemple. 

Il serait naturel à ce stade de penser que bien d’autres bi- 
zarreries vont se produire avec cette définition de R, hormis le 
« problème des infinités de 9 ». On imagine qu'en cherchant un 
peu on va trouver tout un tas d’égalités entre des écritures très 
différentes ! Pourtant, il n’en est rien. De manière surprenante, 
le petit phénomène que nous venons de décrire est la seule dif- 
ficulté à surmonter. 

En d’autres termes, nous pouvons officiellement poser : 


DÉFINITION 2.2 - R est l’ensemble des écritures décimales avec 
une infinité de chiffres décimaux après la virgule qui ne se ter- 
minent pas par une infinité de 9. 


On décide donc de bannir une fois pour toutes de l’en- 
semble R les écritures pathologiques se terminant par des 9. 
Si d'aventure quelqu'un écrit un nombre comme 0,99999... 
nous prendrons ça comme une notation pour le nombre 1 (en 
voyant 0,99999... nous devons réagir comme en voyant 12-11 
ou 3). 

Avec cette nouvelle définition (correcte), il est possible de 
montrer le théorème que voici. 


Nous allons commenter ce théorème point par point. Mais 
d'abord, précisons que nous n'allons pas donner de démons- 
tration - c'est le seul théorème de ce livre que nous ne dé- 
montrerons pas, même si on peut indiquer les grandes lignes. 
L'idée principale est que l'on sait additionner et multiplier les 
nombres décimaux, et il s'agit d'adapter cette procédure dans 
le cas d'un nombre infini de décimales. Les difficultés que l'on 
rencontre sont : 

© Depuis l'école primaire, vous savez additionner et mul- 
tiplier les nombres décimaux par un algorithme. Remar- 
quez que, dans ces calculs, on commence tout le temps 
par le chiffre de droite... Que faire quand il y a une in- 
finité de chiffres ? En gros, il faut montrer que l'on peut 
tronquer les nombres en ne gardant qu'un nombre fini 
de décimales, faire son opération, et alors les premières 
décimales que l'on obtient sont correctes. 

o Le problème des «infinités de 9 » va clairement compli- 
quer les choses. 

o Notre discussion des écritures décimales a été bien 
trop superficielle : il faut commencer par démontrer 
une quantité de résultats basiques, comme l'unicité 
par exemple (c'est-à-dire le fait que si n,aj4a...a; = 
m, bıb2...bẹ alors n = m, k = € et a; = b; pour 1 < i < k). 

© Après pas mal de travail pour montrer que l'addition et la 
multiplication sont bien définies, on n'a pas encore com- 
mencé à montrer les propriétés annoncées dans le théo- 
rème... 

Tout ceci serait très long, mais finalement sans grande sur- 

prise. 

Ce système de nombres appelé R était inconnu des Grecs, 
même s'ils avaient conscience de l’imperfection de Q. Nous al- 
lons voir tout au long de ce livre que les nombres « réels » (les 
éléments de R) sont parfaitement adaptés à la description du 
monde réel : ils peuvent mesurer les longueurs et les aires sans 
mener à des contradictions, par exemple. Nous allons commen- 
cer par montrer que 2 possède une racine carrée dans R, bien 
sûr. 

Avant ça, voici quelques remarques supplémentaires : 


1. Les propriétés arithmétiques vous sont familières. Il n’y 
a rien à retenir vraiment, puisque vous les appliqueriez 
sans réfléchir. Noter que l’on a écrit 0 pour 0, 00000... 
et 1 pour 1, 00000.... Nous ferons pareil avec tous les 
nombres entiers. 


2. Même remarque avec les propriétés d'ordre. 


3. Dans la troisième série de propriétés, on indique bien 
que R contient Q, et pas seulement les nombres déci- 
maux. Par exemple i mest pas un nombre décimal, mais 
c'est bien un élément de R, et en fait c’est 0, 33333... 


4. On dit parfois que « Q est dense dans R » pour exprimer 

le fait qu'entre deux réels a et b, aussi proches que l'on 
veut, il y aura toujours un rationnel x. 
On peut se demander s'il y a une sorte de « réciproque » 
au premier énoncé de ce point 4, qui dirait : si x et y sont 
tels que x < y < x + 107", alors x et y ont «un certain 
nombre » (soyons prudents) de décimales en commun. 
C'est tout-à-fait faux : pour y = 0,999...9000... (prenez 
un nombre de 9 plus grand que n) et x = 1, on a bien 
les inégalités mais les décimales de x et y sont bien dif- 
férentes ! Là encore, le phénomène « des 9 » est le seul 
qui peut vraiment se produire, mais il faut tout de même 
faire attention à ce que l’on dit. 


Faire des calculs concrets avec R ne nécessite pas d’entraî- 
nement spécial, pour la bonne raison que les calculs concrets 
se font toujours dans Q : ça dépend un peu de ce qu’on ap- 
pelle « concret » évidemment, mais dans l’ensemble dès que 
l’on cherche des valeurs numériques, des décimales, on ne va 
en calculer qu’un nombre fini et donc rester dans les nombres 
décimaux. Par contre il va être très utile concrètement de savoir 
que V2 existe, et nous avons besoin de R pour ça. 

Terminons avec les propriétés basiques des réels en mon- 
trant la très utile « inégalité triangulaire ». On définit, pour x € 
R, sa valeur absolue |x| par |x| = x si x > 0 et |x| = =x sinon. Au- 
trement dit, |x| est le plus grand des deux nombres x et =x. On 
en déduit les inégalités suivantes, extrêmement pratiques. 


LEMME 2.4 (INÉGALITÉ TRIANGULAIRE) — Si a et b sont des réels, on 
a l'inégalité 
|a + b| < al + |b|. 


Démonstration. Comme a < |a| et pareil pour b, en additionnant 
on trouve a + b < |a| + |b]. De même -a < |a| et pareil pour b, 
d'où -(a + b) < la| + |b|. Comme |a + b| est soit a + b soit -(a + b), 
l'inegalité est assurée dans tous les cas. 


COROLLAIRE 2.5 (DEUXIÈME INÉGALITÉ TRIANGULAIRE) — Si a et b 
sont des réels, on a 
[lal =|b|| < la = bl. 


Démonstration. En appliquant la première inégalité triangu- 
laire à a et b — a, on obtient 


[b] =|a + (b = a)| < lal + |b al, 


d’où |b|- |a| < |b - al. En inversant les rôles de a et b, on ob- 
tient |al=|b| < |a-b|. Ceci donne bien le résultat puisque |b -a| = 
|a — b], et [lal —1b|| = (lal - |b]). 


BORNES SUPÉRIEURES 
mm 


Si vous avez essayé de réfléchir à la démonstration du théo- 
rème 2.3, vous avez du constater que les arguments concer- 
nant les décimales des nombres sont délicats, et même assez 
pénibles (à établir comme à suivre). Si notre but est de mon- 
trer qu'il existe un nombre dans R dont le carré vaut 2, a-t-on 
envie de se lancer dans une discussion des décimales possibles 
du nombre ? Même si cela fonctionnait, devra-t-on recommen- 
cer de zéro pour 4/3 et V5 et tous les autres ? Il paraît douteux 
qu'on arrive à dégager une méthode générale par une approche 
calculatoire basée sur les décimales. 

Nous allons procéder différemment, et c'est un bon exemple 
de la démarche générale du mathématicien. Nous allons iso- 
ler une propriété de R, appelée « propriété de la borne supé- 
rieure », qui va être finalement la seule chose à savoir sur R : 
toutes les fois où un résultat est faux avec Q, mais devient vrai 
avec R, vous pouvez être sûr que la « borne supérieure » joue un 
rôle clef. On peut remercier ici, comme souvent, les générations 
de mathématiciens qui ont dégagé cette notion pour nous. Sans 
cette observation, on en serait encore à rédiger des arguments 
fastidieux avec les décimales. 

Dans les paragraphes qui suivent, nous donnons la défini- 
tion d’une « borne supérieure » et explorons le concept dans Q, 
pour commencer. Sans surprise, nous verrons que tout ne fonc- 
tionne pas comme on le souhaiterait. Plus loin nous verrons 
que tout marche avec R. 


DÉFINITION 2.6 — Soit A C Q. 

© Soit M € Q. On dit que M est un majorant de A si Va € 
A,a <M. 

© Soit M € Q. On dit que M est le plus grand élément de A si 
c'est un majorant de A et si M E A. 

© En remplaçant < par >, on obtient les notions de minorant 
et de plus petit élément. 

$ Soit 

B = {M EQ | M est un majorant de A}. 


Si B possède un plus petit élément b, on dit que c'est la 
borne supérieure de A et on note b = sup A. 

o De même, si l'ensemble des minorants de A possède un 
plus grand élément, celui-ci est appelé la borne inférieure 
de A, notée inf A. 


On retient que « le sup est le plus petit des majorants », de 
même que « l'inf est le plus grand des minorants ». Nous allons 
voir que le sup et l'inf n'existent pas toujours, et c'est bien là le 
problème. Voyons quelques exemples. 


ExEMPLE 2.7 - Soit 
A=([xeQ|0<x<1j. 


Les minorants de A, pour commencer, sont tous les 
nombres m tels que m < 0, c'est-à-dire qu'ils forment l'en- 
semble 

C={mEQ|m<0}. 


Cet ensemble possède un plus grand élement, à savoir 0. 
C'est donc le plus grand minorant de A, et par définition 
on peut écrire inf A = 0. Ce nombre est également le plus 
petit élément de A. 

Nous affirmons que l’ensemble des majorants de A est 


B=-{MeQIM>1}. 


Montrons-le. Il est clair que les éléments de B sont des ma- 
jorants de A, et il faut montrer qu'il n’y en a pas d’autres. 
Soit donc M un majorant quelconque, et supposons par 
l'absurde que M < 1. On a M > 0 puisque 0 € A, donc 0 < 
M < 1. Considérons alors a = 3 (M+1). OnaM<a<1,donc 
ce nombre s’est glissé entre M et 1, ce qui est absurde : on 
aa € A donc on devrait avoir a < M. Ainsi M > 1 comme 
on souhaitait le montrer. 

L'ensemble B possède un plus petit élément, à savoir 1. 
C'est le plus petit majorant de A, de sorte que sup À = 1. 
Par contre A n’a pas de plus grand élément. 

Les bornes inférieure et supérieure de A sont donc 0 
et 1 respectivement, et nous voyons sur cet exemple qu'il 
s’agit bien des « bornes » naturelles de A au sens intuitif. 
La différence sup A -inf A = 1-0 = 1 donne une mesure de 
la taille de A. 


ExEMPLE 2.8 — Soit maintenant 
A={xeQl|x?<2)}. 


Intéressons-nous aux majorants de A, et notons comme 
d'habitude B l’ensemble qu'ils forment. Cet ensemble est 
non-vide : on a par exemple 10 € B puisque tous les élé- 
ments de A sont < 10. En effet, un nombre x > 10 satis- 
fait x? > 102 = 100 > 2 et ne peut pas être dans A. 

Pour les mêmes raisons, on a 3 € B puisque 3? = 9 
Approchons-nous encore : on voit que 3 € B puisque ($ 
2>2. 

Bien. Supposons que B possède un plus petit élément € ; 
en d'autres termes, supposons que A possède une borne 
supérieure. Que peut-on dire de 6?? En particulier, ce 
nombre est-il plus grand ou plus petit que 2? 

Examinons l'éventualité £? > 2. Notons € = €? -2> 0, et 
prenons ò = >z. Si on calcule 


2 


> 
)? 


(L-5)? =6?+ò* - 282, 
on s'aperçoit de la chose suivante : l'inégalité 
260-8 <28 =É=t?-2 


entraîne (€f - 5)? > €? +(2 - £?) = 2. Le nombre M = £- ô 
est donc un majorant de A puisque son carré est > 2, par le 
même raisonnement qui nous a servi à montrer que 10, 3 
et 3 sont des majorants. 

Mais c'est absurde puisque M < € et que £ est censé être 
le plus petit majorant! Cette contradiction réfute l'hypo- 
thèse selon laquelle £? > 2, et on en tire €? < 2. 

On peut maintenant se demander si £? < 2. Dans cette 
hypothèse, notons ë = 2-4? > 0. Choisissons n'importe quel 
nombre ò > 0 tel que l'on ait à la fois ò < 2€ et ò < 37. On 
note alors que 5? < 2ôf et donc que 


8 +240 <45 < €. 


Par suite, ({+ 5)? <€? +€ = 2. Donc a = l + ò est un élément 
de A. C’est de nouveau absurde puisque a > £ alors que € 
est un majorant. 

Il ne nous reste pas d'autre choix que d'envisager 
que €? = 2. Mais c’est également impossible en vertu de 
la proposition 2.1! 

Finalement, cette borne supérieure £ ne pourrait satis- 
faire ni €? < 2, ni €? > 2, ni €? = 2. On en arrive à la conclu- 
sion que l'ensemble A ne possède pas de borne supérieure. 


BORNES SUPÉRIEURES DANS KR ET RACINES CARRÉES 
[PMM] 


En remplaçant Q par R dans la définition 2.6, on obtient les 
notions de bornes supérieures et inférieures dans R. Or, on a 
maintenant le théorème essentiel suivant. 


THÉORÈME 2.9 — Soit A C R une partie non-vide et majorée. 
Alors A possède une borne supérieure dans R. 

Une partie A C R non-vide et minorée, de même, possède une 
borne inférieure dans R. 


La démonstration est un peu compliquée, puisqu'on rai- 
sonne sur les décimales (que faire d'autre à ce stade ?), mais 
ça sera la dernière fois que nous aurons à le faire ! 


Démonstration. On va montrer l'existence de la borne supé- 
rieure, l’autre cas étant similaire. Pour faciliter les notations, 
on va supposer que A possède au moins un élement > 0, et 
donc que tous les majorants de A sont > 0 (exercice : comment 
faire pour se ramener toujours à ce cas ?). La borne supérieure 
va s'écrire x = n, dyd}... et nous allons trouver la partie en- 
tière n € N et les décimales d; petit à petit. 

Soit B C N l’ensemble de nombres entiers N qui sont des 
majorants de A. L'ensemble B est non-vide, il possède donc un 
plus petit élément No. Nous allons suivre l'argument sur un 
exemple (en parallèle du cas général), donc disons que Nọ = 5. 
Si No € A, alors c'est le plus grand élement de A (puisque c'est 
un majorant), c'est donc le sup et on a fini. Supposons donc 
que No € A. Le nombre n = Nọ - 1, donc n = 4 dans l'exemple, 
est la partie entière que nous cherchons (on va le montrer). 

Par définition n n'est pas un majorant de A, mais n+ 1 
si, donc il existe des éléments de A qui s'écrivent n, ajaz... 
Soit c le plus grand chiffre en première position après la vir- 
gule parmi les éléments de A plus grands que n; si c =7 par 
exemple, cela signifie que A contient un ou plusieurs éléments 
de la forme 4,7... mais aucun de la forme 4,8... Si c < 9 on 
pose c’ =c +1 et x, = n, c' (dans l'exemple x, = 4,8); alors x, 
est un majorant de A, et si x, € À alors x, = sup À et on a 
fini (donc d, = c' et d; = 0 pour i > 2). Sinon, si x, € A, on 
pose dı = c et on continue. Dans le cas où c = 9 on pose x; =n 
et d, = 9 et on poursuit également. 

Maintenant on redéfinit c comme étant le plus grand chiffre 
en deuxième position après la virgule parmi les éléments de A 
plus grands que n, dı ; si par exemple c = 5, alors A contient des 
éléments qui s'écrivent 4,75... mais aucun qui s'écrit 4,76... Si 
le majorant x) = 4,76 appartient à A, c'est le sup et on a fini; 
sinon on continue, en posant d, = 5. 

Un dernier tour explicite : on définit c comme étant le 
plus grand chiffre en troisième position après la virgule parmi 
les éléments de A plus grands que 4,75 ; admettons que dans 
l'exemple on ait cette fois-ci c = 9, donc A possède des élements 
de la forme 4,759... (et dans le cas d’un 9, on sait déjà depuis 
l'étape précédente que A ne possède pas d’élément qui com- 
mence par 4,76...). On pose dz = 9 et x3 = x} = 4,76. 

On va continuer ce procédé autant que possible. Si à un mo- 
ment donné l’un des x; € A, alors comme on l’a dit c'est un 
sup et la démarche s'arrête. Supposons donc que l’on soit forcé 
de continuer sans cesse, appliquant l’algorithme ci-dessus qui 
produit des décimales d;,d;,,d3,... et des majorants x1, X2, X3... 
de A. On note que xç est un nombre décimal, qui commence 
par n, did)...dy_1; sa k-ième décimale est soit dp + 1 si dy < 
9, soit O sinon, alors que toutes les décimales suivantes sont 
nulles. Par ailleurs si xj désigne le nombre obtenu en dimi- 
nuant de 1 la dernière décimale non-nulle de x}, alors x, mest 
pas un majorant de A. 

Posons alors x = n,d;d,d3..., de sorte que x < x; pour 
tout k. Si on peut montrer que x est un majorant de A, alors 
ce sera visiblement le sup : en effet tout nombre < x doit être 
< x, pour un certain k, et donc n’est pas un majorant. 

Supposons donc par l'absurde qu’il existe a € A tel que a > 
x. D'après le (4) du théorème 2.3 on a rg < x < rç + 107%, où rg 
est le nombre obtenu à partir de x en tronquant à la k-ième 
décimale ; de même, puisque x et xx.1 ont k décimales en com- 
mun, on a rk < xk41 < rp +10 À. On en déduit en soustrayant 
que -10% < Xk41 - X < 10, et donc Xp+1 < X+ 107%. En pre- 
nant k suffisamment grand, on aura x + 107% < a, d’où l'absurde 
conclusion que x41 < a alors que x4,1 est un majorant. 


Ce théorème est la seule chose à savoir sur R, vraiment. 
Nous le disions ci-dessus, nous avons laissé pas mal de dé- 
tails de côté en donnant la définition de R, mais ça n'a aucune 
importance pour la suite, si vous savez que les sup et les inf 
existent dans R. Par ailleurs, si vous comparez avec d'autres 
manuels (ou avec la page Wikipedia), vous verrez que l'on dé- 
finit parfois l'ensemble des réels bien différemment (certains 
utilisent les « suites de Cauchy », d'autres les « coupures de De- 
dekind »...). Le fait même que plusieurs constructions existent 
montre bien que les particularités de l'une d'entre elles ne sont 
pas cruciales. Tant que l'on se met d'accord sur l'énoncé du 
théorème 2.3 et celui du théorème 2.9, on parle nécessairement 
de la même chose (voir par ailleurs l'encadré « Unicité de R »). 


En guise de première application, voici enfin le résultat qui 
indique que les racines carrées existent dans R. 


Proposirion 2.10 - Soit a € R un nombre positif, c'est-à-dire a > 0. 
Alors il existe un nombre x € R, et un seul, tel que x > 0 et x? = a. 
On note ce nombre Va et on l'appelle la racine carrée de a. 


Démonstration. Cette démonstration va nous donner l'occasion 
unique d'indiquer à plusieurs reprises quelles propriétés du 
théorème 2.3 nous sont utiles, même les plus évidentes, pour 
que vous voyiez bien que les raisonnements habituels reposent 
toujours sur ces quelques règles (nous n'avons pas encore mis 
l'accent là-dessus, et nous ne le ferons plus par la suite). On ne 
va pas indiquer toutes les propriétés que l'on utilise - ça serait 
long et pénible à suivre - mais seulement quelques unes. 

Voyons d'abord l'unicité. Soit donc xg > 0 tel que xj = a, et 
cherchons tous les x > 0 tels que x? = a. On a 

dv x2-x5=0, 
<> (x x0)(x + Xo) = 0. 


(Pourquoi cette factorisation est-elle valide?) Lorsqu'un pro- 
duit ab de deux nombres réels a et b vaut 0, l’un de ces nombres 
doit être nul : en effet si a + 0, alors 1 existe d'après le (1)(i) 
du théorème 2.3, et en multipliant par + on obtient +(ab) = 
(Ła)b =1b=b= 10 = 0 (nous avons utilisé les propriétés (1)(g), 
puis (1)(i), puis (1)(f) ; le fait que x0 = 0 pour tout x se montre 
à partir des propriétés : faites-le !). Donc b = 0. 

Ici (avec a = x — x et b = x + xg) on voit que x = xÍ ou x = 
—X). Comme 0 < x Í, on observe en ajoutant —-x, de chaque côté 
que —xọ < 0 (propriété (2)(e) du théorème). Ainsi, dans le cas 
où x = —xọ, on constate que x est à la fois < 0 et > 0; c'est donc 
que x = 0 par la propriété (2)(d), d'où x = xg = 0. Finalement x = 
xo quoi qu'il arrive, et l'unicité est démontrée. 

Passons à l'existence. Sans surprise, on pose 


A={xeR|x? <a}. 


Si l’on trouve un nombre M tel que M? > a, alors ce sera un 
majorant de A. (Pour vérifier ceci, démontrez que si x > M, 
alors x? > M? lorsque M > 0.) Or on peut tout simplement 
prendre M = a si a> 1, et M = 1 si a < 1 (pour le casa = 1, 
la proposition est évidemment vraie). 

Puisque l'on est dans R, on sait que A possède une borne 
supérieure, en tant qu’ensemble non-vide (il contient 0) et ma- 
joré; posons donc x = sup A. Il faut montrer que x? = a. Nous 
avons déjà fait le raisonnement dans l'exemple 2.8 dans le 
cas où 4 = 2; en procédant exactement de la même manière, 
on trouve que x? < a et x? > a mènent à des contradictions. 


Donc x? = 4. 0O 


Par la suite, nous montrerons même que tout nombre posi- 
tif a possède une unique «racine n-ième » notée Va ou añ, c'est- 
à-dire qu'il existe un unique nombre positif x tel que x" = a. 
Vous pouvez essayer de démontrer ce résultat maintenant sur 
le même modèle : c'est un peu fastidieux, mais on y arrive. 
Nous allons préférer déduire le résultat du très utile « théo- 
rème des valeurs intermédiaires » (4.8), qui montrera tout son 
intérêt. 


voir les exercices 
477, 470, 472 


voir les exercices 
456, 461 


LES NOMBRES COMPLEXES 
[= 


Nous n'avons pas encore toutes les racines carrées que l'on 
pourrait souhaiter : il manque encore les racines des nombres 
négatifs. En effet si x € R, alors x? > 0, et donc par exemple il 
n'y a pas de nombre réel dont le carré serait -1. Il nous faut 
donc un système de nombres encore plus étendu. 

Cette fois-ci, les choses sont beaucoup plus simples. Nous 
allons voir qu'il suffit de « rajouter » un nombre i tel que i? = 
—1, et toutes les racines carrées imaginables sont obtenues - et 
même bien plus. 

Comment donc « rajouter » ce i ? Si notre nouveau système 
de nombres contient R et un tel nombre i, alors il doit contenir 
des nombres de la forme x + iy avec x,y € R. De plus si les 
règles usuelles de calcul s'appliquent (ce que l’on souhaite), on 
doit avoir 


(x+iy)+(x +iy)=(x+x)+ily +y), 
ainsi que 
(x+ iy)(x + iy’) = (xx — yy’) +i(xy + x'y). 
Ceci motive la définition suivante. 


DÉFINITION 2.11 — Sur le produit cartésien R x R, on définit une 
addition par 


(x y)+ (x,y) =(x+x,y +y), 


et une multiplication par 


ooe = e = a a + x'y). 


Muni de ces deux opérations, l’ensemble R x R est noté C, et 
appelé ensemble des nombres complexes. 


Voyons pourquoi cette définition est la bonne. Si x, x’ sont 
réels, on a 


(x,0)+(x”,0)=(x+x,0) et (x, 0)(x’,0) = (xx’, 0). 


Donc l’ensemble des nombres complexes de la forme (x,0) se 
comporte exactement comme l’ensemble R. On peut identifier 
ces deux ensembles sans risque de confusion, et lorsque x € R 
on écrira également x pour le nombre complexe (x, 0). (Le lec- 
teur qui a pris connaissance de la définition 1.13 parlera plutôt 
d’une bijection x H> (x,0), qui se trouve être compatible avec 
les opérations arithmétiques.) 
Ensuite, posons i = (0,1). On a bien 


i? = (0,1)(0,1) 
) 


Il 

| 
— 
c 


Enfin, pour tout réel y, on a iy = (0,1)(y,0) = (0,y). Fi- 
nalement tout nombre complexe (x,y) peut s'écrire (x,y) = 
(x, 0) +(0,v) =x+ ivy. 

On vient de montrer que R C C, que C contient une racine 
de -1, et visiblement C ne pouvait pas être plus petit. Tout se 
passe décidément bien, puisqu'on a le résultat suivant : 


Proposition 2.12 — L'ensemble C satisfait les neuf propriétés (1) 
(a-b-c-d-e-f-g-h-i) du théorème 2.3. En d'autres termes, les règles 
de calcul usuelles s'appliquent. 


Démonstration. Ce sont des vérifications évidentes, sauf pour 
la (1)(i). Étant donné z = x + iy un nombre complexe non-nul, 
il faut trouver un nombre complexe w tel que zw = 1. Un tel 
nombre, s’il existe, serait évidemment unique, et ce serait z. 

On appelle conjugué de z le nombre Z = x- iy. On a zz = 
x? + y?; ce dernier nombre est un réel positif, on peut no- 
ter |z| = yx? +y?, que l'on appelle le module de z. Notons que 
lorsque z + 0, on a |z| > 0; en particulier H existe. 

Soit alors 


Z x . 
i y 


== =< É . 
z2 ` x2+y2 ‘xp 


C'est bien un nombre complexe, et on a zw = _ = 1. Donc w = 


21 


Remarque 2.13. L'opération de conjugaison que nous venons 
d'utiliser possède de bonnes propriétés : en effet Z+ w =Z +w 
et ZW = ZW pour tout z,w € C, comme on le vérifie facilement. 
Par suite on a 


|zw|? = zwzw = zzww = |z|?|w]?. 


En prenant les racines carrées de ces nombres réels, on a égale- 


ment |zw| = |z| [w]. voir les exercices 


1, 5127 


Nul besoin de chercher de système de nombres plus grand 
pour obtenir des racines carrées. En effet : 


PropositioN 2.14 - Tout nombre complexe w € C non-nul possède 
exactement deux racines carrées, qui sont opposées. 


« Opposées » signifie que l'on a deux racines z et -z, et au- 
cune autre. 


Démonstration. Il est très facile de voir que si w possède une 
racine ZÔ, alors il en possède exactement deux : en effet 


z =w <> 22 =0 
<> (2-20)(z +20) = 0 


<> z=ZjO0UZ=-Z. 


Pour l'existence, écrivons w = a+ib, et cherchons un nombre z = 
x+ iy tel que z? = w. Ceci revient à résoudre 


= = a (1) 


2xy = b (2). 


Il est astucieux ici de regarder les modules : on doit avoir |z|? = 
|z?| = [w], et donc 


x? +y? = Va? + b? (3). 
En faisant (1) + (3) on tire 


2 _ a+ Va? +b? 
g 2 


Le membre de droite est un réel > 0, donc cette dernière équa- 
tion a bien des solutions, ce qui donne deux choix opposés 
pour x. De même en faisant (3) -— (1) on obtient 


2 _ -a+ Va? +b? 
p 2 


Là encore on a deux possibilités pour y. 

Quels que soient les choix, l'équation (1) est satisfaite; 
quant à l'équation (2), on est seulement assuré d’avoir 4x?y? = 
b? et donc 2xy = +b. Il suffit alors d’ajuster le signe de x ou de y 
pour satisfaire (2). 


ExEMPLE 2.15 - Soit w = 1 - 2i, et cherchons z = x + iy tel 


ue z? = w. Comme dans la démonstration, on constate 
q 


que l’on doit avoir 


x2 a y? — 1 
2xy = -2 
x? +y? = V5. 
Toujours en suivant le modèle de la démonstration, on en 
déduit 
2 1+V5 2 -1+V5 
X S= et y = ——. 
2 2 
L'équation 2xy = —2 nous dit que x et y doivent être de 


signes opposés. On peut donc prendre 


1+V5 = -1+ V5 


2 ?= 2 


Les deux solutions sont alors x + iy et —x — iy. 


On sait même résoudre dans C des équations un peu plus 
compliquées : 


ProPosirioN 2.16 — Soient a, b et c trois nombres complexes, 
soit À = b? — 4ac, et enfin soit à E C tel que 5? = A. On suppose 
quea+0. 
Alors l'équation 
az?+bz+c=0 


possède exactement deux solutions lorsque À + 0, données par : 


—b+ù 
D 


Dans le cas où À = 0, ces deux solutions se confondent et il n’y en 
a pas d'autres. 


Démonstration. On écrit simplement 


az?+bz+c=0 = 4a?z? + 4abz+4ac=0 
<> (2az+b)?+4ac-b?=0 
<> (2az+b) =A, 


É S voir les exercices 
et donc 2az + b doit être +ò. pe 


À ce stade, vos souvenirs de Terminale vous poussent sans 
doute à attendre une description de la « forme polaire », la fa- 
meuse écriture z = pe'°. En réalité, pour expliquer rigoureu- 
sement ce qu'il se passe, il va falloir patienter : il nous faut 
d’abord voir une quantité d’autres résultats. En contrepartie, 
quand nous arriverons enfin à cette écriture, nous aurons des 
vraies définitions du cosinus et du sinus, entre autres choses. 

Vous pouvez toutefois aller voir tout de suite le passage 
consacré aux nombres complexes dans l’appendice A. On y 
donne (sans justification !) les mêmes explications qu’au lycée. 


- Fin de la première lecture — 


CALCULS SUR MACHINE ET CORPS 
[a] 


Les systèmes de nombres R et C semblent répondre à tous 
nos besoins en théorie. En pratique par contre, les choses ne 
sont pas aussi simples. Dès que l’on commence à faire des cal- 
culs un peu longs, le besoin de confier la tâche à un ordina- 
teur se fait sentir. Or, les nombres réels sont très abstraits, nous 
l'avons dit ; tout ce qu’une machine va savoir faire, c'est utiliser 
des approximations, comme par exemple 


1414213 


pour approcher V2. En fait les machines ne connaissent que Q 
(et encore, avec des limitations sur la taille des nombres en- 
tiers employés en fonction de la mémoire, mais on peut laisser 
ce problème de côté). Ces approximations sont une source d’er- 
reur importante. Ainsi si l’on calcule 


x’? = 65535, 1660562286 --- 


on est bien loin de V2” = 216 = 65536. Même en sachant 
que x°? est censé approcher un nombre entier, arrondir à l’en- 
tier le plus proche ne donne pas la bonne réponse! Aussi, no- 
tons que 7 chiffres de x sont corrects, alors que seulement 4 
chiffres de x3? sont corrects. 

Cependant, admettons que l’on entreprenne une série de 
calculs, dans lesquels on est certain de n’utiliser rien d'autre 
que des nombres rationnels et V2. On peut tout simplement 
apprendre à l'ordinateur à manipuler les nombres de la forme 
a+ bV2 avec a, b € Q. En effet il suffit de stipuler les règles sui- 
vantes : 


(a+bV2)+(a'+b'V2)=(a+a)+(b+b')V2, 


et 
(a+bV2)(a' +b'V2) = (aa + 2bb') + (ab' + a'b)V2. 


On conçoit bien comment un ordinateur peut considérer ces 
nombres commes des paires (a,b) de rationnels et opérer les 
additions et multiplications directement sur ces paires (un peu 
comme dans notre définition de C avec des paires de réels). 
Voilà un nouveau système de nombres qui apparait naturelle- 
ment, et sur le même modèle on en entrevoit une infinité. Il est 
temps de leur donner des noms précis. 


DÉFINITION 2.17 - On dit que l'ensemble K est un anneau lors- 
qu'il est muni d'une addition 


KxK => K 
(x,y) H» x+y 


et d’une multiplication 


KxK => K 
(&y) H xp 


ainsi que de deux éléments notés 0 et 1, tels que les propriétés 
suivantes sont satisfaites : 

(a)x+y=y+x, 

(b)0+x=x, 

(c) (x+ y) + z =x + (y + z), 

(d) Vx 3(=x) tel que x + (=x) = 0, 
Lorsque de plus on a 


(e) x(y + z) = xy + xz 
et (x+ y)z = XZ + yz, 
(N Ix xl Ex; 

(g) (xy)z = x(yz). 


(h) 
on dit que K est un anneau commutatif. 


Finalement, si en plus des propriétés (a-b-c-d-e-f-g-h) on a 
également 


xy =yx, 


(i) Vxz0 gx! tel que xx ! =1, 
on dit que K est un corps. 
En d'autres termes, dans un corps les règles usuelles de cal- 
cul doivent s'appliquer. 


ExEMPLE 2.18 — Les ensembles Q, R et C, avec les opéra- 
tions usuelles, sont des corps. 


ExEMPLE 2.19 — Soit K = {a + bV2 | a, b € Q} avec les opéra- 
tions définies ci-dessus. On va montrer que K est un corps. 
En fait les opérations sont « héritées » de celles de R (no- 
tez que l'on a K C R), et par conséquent les propriétés a- 
b-c-d-e-f-g-h sont automatiquement satisfaites. Mais il en 
manque une! 

En effet, il n'est pas évident que si x = a + bV2 € K, 
alors x ! € K lorsque x # 0 (on est simplement certain 
que x ! existe dans R). Cependant un petit calcul nous ras- 
sure : 


a-bV2 
(a+bV2)(a=bV2) 
a 


—b 
Er t pop V2EK- 


noo i 
x a+by2 


Un avertissement. Nous avons multiplié numérateur et dé- 
nominateur par a- bV2, et ceci n'a un sens que sia— bV2 + 
0. Or dans le cas contraire, on aurait V2 = $ avec a et b 
rationnels, ce qui est impossible d'après la proposition 2.1. 


Ce corps est noté généralement Q[1/2]. 


ExEMPLE 2.20 - L'ensemble Z est un anneau commutatif, 
mais ce n'est pas un corps. En effet la propriété (i) de l'in- 
verse n'est pas satisfaite, par exemple 4 € Z. 


Il va falloir attendre le chapitre 12 pour avoir un exemple 
d'anneau non-commutatif. 


« Anneau » est 
une mauvaise 
traduction de 
l'allemand 
Ringe, qui 
signifie 

« cercle », dans le 
sens de 


« communauté ». 


L'expression 

« corps » à 

l'origine était 

comprise dans le 
, 

sens d'un corps 

de métier, ou 

d'un corps 


d'armée. 


ARITHMÉTIQUE DE L'HORLOGE 
[ne EEE 


Nous allons donner d'autres exemples de corps, qui ne pos- 
sèdent qu'un nombre fini d'éléments. Ils sont utilisés extrê- 
mement souvent en théorie des nombres, en informatique, en 
cryptographie, etc. 

L'idée de départ est simple. Lorsqu'il est 23h et qu'on at- 
tend un événement qui doit se dérouler 4h plus tard, on calcule 
rapidement qu'il aura lieu à 3h du matin. S'il est 19h et que l'on 
a 7h à attendre, on sait bien que cela va nous amener à 2h du 
matin. Le raisonnement que l'on fait sans y penser consiste à 
additionner les deux nombres (on obtient 27 dans le premier 
cas, et 26 dans le deuxième), puis à retrancher 24 puisque les 
journées reprennent à 0 à ce moment-là. 

On dit que l'on calcule modulo 24. Vous savez aussi spon- 
tanément calculer modulo 12 : il suffit de ne pas différencier 
le matin et l'après-midi, comme lorsqu'on vous demande d'at- 
tendre pendant 5h à partir de 11h et que vous savez presque 
immédiatement que vous en avez jusqu'à 4h (de l'après-midi). 
Là encore on fait 11 +5 = 16 puis 16 - 12 = 4 puisque l'on veut 
un résultat entre 0 et 12. 

On va définir maintenant des opérations modulo N, pour 
tout entier N > 2, sur le même modèle. Rappelons avant de 
commencer ce qu'est une division euclidienne : étant donnés 
deux nombres entiers a et b + 0, vous savez que l’on peut trou- 
ver deux nombres entiers q (le quotient) et r (le reste), uniques, 
tels que 

a=bq+r, 


et 0 <r < b. Par exemple, en faisant la division de 16 par 12 on 
écrit 16=12x1+4doncqg=1etr=4. 


DÉFINITION 2.21 — Sur l’ensemble {0,1,2,...,N — 1} on définit 
une addition par 


x@ y = le reste dans la division euclidienne de x +y par N, 
et une multiplication par 
x@ y = le reste dans la division euclidienne de xy par N. 
On écrit Z/NZ pour désigner l’ensemble {0,1,2,...,N-—1} muni 
de ces opérations. Ton 


De plus les éléments de Z/NZ vont être notés 0,1,...,N —1 
(pour les distinguer des mêmes éléments vus dans Z). 


ExEMPLE 2.22 - Prenons N = 24. Si l'on voit 23 et 4 comme 
des éléments de Z/24Z, on peut calculer 23 @ 4. Comme 


23+4=27=24x1+3, 
on a 23 @4 = 3. De même : 
23x4=92=24x3+20, 


donc 23 @ 4 = 20. 


EXEMPLE 2.23 — Prenons N = 2; on a maintenant Z/2Z = 
{0,1}. Le seul calcul un peu étonnant est 1 @ 1 = 0 : en effet 


1+1=2=2x1+0. 


Sinon on a sans surprise 0@0 = 0, et 0@1 = 160 = 1. La mul- 
tiplication ne vous étonnera pas non plus. Écrivons les ré- 
sultats complets sous forme de tableaux (sans les « barres » 
pour alléger) : 


@|0 1 @ 
010 1 et 0 
111 0 1 


2. > C 
= ol 


Peut-on appliquer les règles de calcul usuelles avec Z/NZ? 
Pour vérifier ceci, définissons la fonction « reste » : 


R:Z — Z/NZ 
x H>  R(x)= le reste dans la division de x par N. 


ProposiITION 2.24 - On a 
R(x+y)=R(x)@R(y) et R(xy) = R(x) @R(y). 


Démonstration. Écrivons les divisions euclidiennes x = Nq, + 
R(x) et y = Nq? + R(y). En additionnant on trouve 


x+y = N(q1 +q2) + (R(x) + R(y)). 
Il se peut que R(x) + R(y) soit > N; écrivons donc une nouvelle 
division 
R(x) + R(y) = Ng3 +r. 
Ici par définition le reste r = R(x) @ R(y). En regroupant : 
x+y=N(g+g+gs+r, 


et 0 < r < N, donc r est bien le reste dans la division euclidienne 
de x+y par N. C'est-à-dire que r = R(x + y) = R(x) &R(y). 
On procède de même pour la multiplication. 


COROLLAIRE 2.25 - Les propriétés de calcul (a-b-c-d-e-f-g-h) sont 
valables dans Z/NZ, pour l'addition @ et la multiplication @. Les 
rôles de O et 1 sont joués par O et 1. 

(En d'autres termes, Z/NZ est un anneau commutatif.) 


Démonstration. Soient x, y et z des entiers. Puisque x(yz) = 
(xy)z, en appliquant la fonction R on a R(x(yz)) = R((xy)z), ce 
qui donne en utilisant la proposition 


R(x) @R(yz) = R(xy) 8 R(z), 


puis 

R(x) @ (R) @ R(z)) = (R(x) @ R(y)) 8 R(2). 
Par suite, la multiplication @ est associative (propriété (g)). On 
fait pareil pour les autres propriétés. 


L'ensemble Z/NZ est-il un corps? En d'autres termes, que 
peut-on dire de la règle (i) de l'inverse ? Voyons des exemples. 


ExEMPLE 2.26 -Pour N = 2, le seul élément non-nul 
de Z/2Z est x = 1. On a x @ x = 1, donc x ! existe et on 
a même x ! = x. Ainsi Z/2Z est un corps. 


ExEMPLE 2.27 - Prenons N = 24. Comme 
3x8=24=24x1+0, 
on a 3@8 = 0. On en déduit que l'inverse de 3 n'existe pas : 


en effet si l'on avait un élément (3)! tel que (3) !@3=1, 
on aurait 


3) @(388) =((3) !03)@8=188=8=(3) !@0=0. 


Or 8 + 0. Donc Z/24Z n'est pas un corps. 


Dans le chapitre 11 nous allons déterminer les valeurs de N 
telles que Z/NZ est un corps. Vous pouvez essayer de deviner 
la réponse. 

Nous allons conclure ce chapitre par une simplification des 
notations. Il est clair qu'écrire x@ y et x@ y va devenir fatigant 
très vite, donc on va noter x + y et xy. Par ailleurs, pour tout 
nombre x € Z on va utiliser la notation x = R(x). Il ne faut pas 
confondre avec la conjugaison complexe, mais puisque la pro- 
position 2.24 nous dit que 


Xx+y=x+Yy et xy=xy, 


la notation se comporte comme prévu. De plus ceci est cohé- 
rent avec les « barres » que nous avons déjà, puisque R(x) = x 
pour 0 < x< N. 

C'est la présence des barres qui, par convention, signifie que 
les calculs sont faits avec un modulo, qui en général est sous- 
entendu. Certains auteurs, pour éviter les ambigüités, pré- 
fèrent utiliser une notation plus complète, du genre 


8+4=0 (12), 
ou encore 
8+4= 0 mod 12, 


là où, dans ce cours, nous écrivons 


8+4=0, 


le « 12 » étant sous-entendu. Mentionnons par ailleurs l'expres- 
sion « x est congru à y modulo N » pour indiquer que x = y 
dans Z/NZ. ne 


voir les exercices 


Deuxième partie 


Analyse 


Chapitre 3 


Suites 


SUITES DE RÉELS 
MMi 


DériniTIoN 3.1 - Une suite de nombres réels est simplement 
une fonction u: N => R. En général on écrit u, au lieu de u(n), 
et on écrit (un)n>0 pour désigner la suite elle-même. 


ExEMPLE 3.2 - La suite définie par u„ = n? commence par 


0, 1, 4, 9, 16, 25, 36,... 


On emploie souvent une formule directe pour u„ en fonc- 
tion de n, et dans ce cas on parle directement de « la 
suite (n?)„>0 ». 

On s’autorise aussi à parler de suites qui ne sont dé- 
finies que pour des valeurs de n suffisamment grandes; 
ainsi de la suite (ui par exemple. On veillera à toujours 
indiquer le domaine de définition, ici l’ensemble des en- 
tiers > 1. Évidemment l'étude de cette suite se ramène à 
celle de (+ )„>o : dans les deux cas il s’agit de comprendre 


n+l 
la séquence de nombres 


1, 


pers 


OR 


1 1. 1 
2” 3” 47 


L'écriture (Ln>1 est donc juste une notation commode. 


ExEMPLE 3.3 - Une autre façon commune de décrire une 
suite est d'utiliser une relation de récurrence : par exemple, 
on peut considérer la suite (un)n>0 définie par ug = 1 
et u,,1 = 2U,. Elle commence par 


1,2, 4, 8, 16, 32, 64, 128,... 


Dans cet exemple on voit tout de suite que u„ = 2". Pour le 
démontrer, sans surprise on procède par récurrence : on a 
bien ug = 29 =1 et si u„ = 2” alors di = 2-2” = 2”*1, 

Les choses sont en général bien plus compliquées. Que 
l’on considère la suite (v,),-0 définie par à peu près mim- 
porte quelle formule de récurrence choisie au hasard, di- 
sons vy41 = cos(v,)+ (sin(v„))3, et l'on verra la difficulté 
qu'il peut y avoir à trouver une formule pour v,. 


ExEMPLE 3.4 — On peut aussi utiliser une relation de ré- 
currence qui fait intervenir plusieurs termes antérieurs. 
La célèbre suite de Fibonacci est définie par ug = u1 = 1 et 
par Un+2 = Uns1 + Un. Elle commence donc par 


1, 1,2, 3, 5,8, 13, 21, 


Bien plus tard nous verrons comment trouver une expres- 
sion pour u„ dans le cas de cette suite (voir page 129). 


ExEMPLE 3.5 — Soit (4,),>0 une première suite. On peut 
alors définir (u,),>0 par 


n 


Un=90+a1 += +a p= ak. 
k=0 


On dit alors que (u,),>0 est la série de terme général a„. 

Par exemple lorsque a„ = r" pour un réel r, de sorte 
que u„ =1+1+12+-+++ r", on dit que (u,) est une série 
géométrique (de raison r). On peut très facilement trouver 
une expression pour u„ en remarquant que 


uall -=r)= (Ltr tr”) (r+r? + erl) =1=_q8H ; 


Si r + 1, on en déduit 


C'est une formule qui sert tout le temps, elle est donc à 
savoir. 


CONVERGENCE 
— 


C'est à l’aide des suites que l’on va pouvoir traduire mathé- 
matiquement diverses notions de rapprochement : quantité qui 
s'approche «infiniment près » de 0, courbes qui se rapprochent 
« à l'infini », droites et cercles tangents à une courbe, et tant 
d’autres idées intuitives vont d’une façon ou d’une autre se ra- 
mener à des questions de suites. 

La définition ci-dessous est au cœur de nombreux concepts 
dans ce livre. Il est donc normal qu’elle paraisse un peu difficile 
à saisir au début, et il faut prendre le temps de l’apprivoiser. 
Il s’agit de donner un sens à l’idée d’une suite qui se rappro- 
cherait aussi près que l’on souhaite d’une valeur donnée. La 
formulation finale est due à Cauchy. 


DÉFINITION 3.6 — Soit (un)n>0 une suite de nombres réels, et 
soit € E R. On dit que (u,) converge vers €, ou admet € pour li- 
mite, lorsque la condition suivante est satisfaite : pour tout £ > 0 
il doit y avoir un entier N, tel que |u, — £| < £ dès que n > N,. 

En d’autres termes, pour toute marge d'erreur e donnée, la 
distance entre u„ et € va devenir inférieure à € pour peu que 
l’on prenne des indices suffisamment grands. 

Dans ce cas on note 


Un — À ou lim u, = €. 
n= n= 


Essayons de comprendre cette définition graphiquement, 
pour commencer. Et d’abord, comment dessiner une suite ? 

Nous allons procéder comme sur la figure ci-dessous. Les 
points représentés sont ceux de la forme (n, u,), c'est-à-dire que 
le diagramme se lit de la gauche vers la droite à mesure que les 
indices augmentent. On a tracé les axes dans le plan RxR, ainsi 
qu'une droite d’équation y = € vers laquelle la suite semble 
s’accumuler. C’est une bonne façon de visualiser la conver- 
gence vers un nombre €. 


Revenons à la définition. Étant donné un réel e, la condi- 
tion |u„ — {| < € est vérifiée lorsque (n,u,) se trouve dans une 
bande horizontale délimitée par les droites y = £ +e et y = £ — e. 
Le nombre N, existe lorsqu'on peut tracer une droite verticale 
comme ci-dessous, d’équation x = N;, à la droite de laquelle 
tous les points (n, u„) sans exception sont dans la bande. 


Ne 


Ce N, doit exister pour tout e, et bien sür les difficultés ar- 
rivent lorsque e devient de plus en plus petit. La bande devient 
plus étroite et la droite verticale se déplace vers la droite. 


l+e 
t ci 


N: 


Voyons maintenant des exemples. 


ExEMPLE 3.7 -Considérons la suite (us et montrons 
qu'elle converge vers 0. Notons u, = L, Soit donc € > 0 
comme dans la définition. Pour avoir |u, — 0] = 1 < €, il faut 
et il suffit que n > L. Soit donc N; n'importe quel entier tel 
que N; > L, On constate bien que lorsque n > N,, alors on 
a aussi n > 1 et donc |u,| < £. Par définition, ceci montre 
que un => 0. 

(Voir l'encadré « R est archimédien » pour quelques 
commentaires sur cet exemple.) 


ExEMPLE 3.8 - Maintenant voyons («"),>-0 pour un réel 0 < 
a < 1. Montrons que la suite tend encore vers 0. 
Puisque |a” — 0| = |a”| = a", il s’agit de majorer les termes 
de la suite par quelque chose de facile à comprendre. 

Prenons un nombre rationnel É tel que a < É < 1 (voir 
(3) du théorème 2.3). On a q > p et comme il s'agit d'entiers, 
on est même sür que q > p +1; ainsi 


q P+D 


Remarquons que 


(p+1)" = (p+1)(p+1)---(p+1) 
= p" +np"-! + (termes > 0) 


> p" + np". 
1)" . 
On a donc = >1+ = > D et par suite 
a” < P. 
n 


La suite (Eat tend vers 0, exactement comme la 
suite (1) >1 (la constante p ne change rien à l'affaire). Donc 
étant donné e > 0, il existe bien N, tel que Ë < ë pour n > 
N; ; pour ces mêmes valeurs de n, on a donc aussi a" < e, et 
finalement a” => 0. 

n= o0 


ExEMPLE 3.9 - On note n! = n(n- 1)(n-2)---3x2x 1, et on 
appelle cette quantité « factorielle n ». C’est le produit de n 
termes qui sont tous > 2 sauf le dernier; on a donc n! > 
DIRE, 

Si l'on étudie la suite (4)„>1, il suffit de remarquer que 


1 1 
0< =< 


n-1 1 
q < gnt =(;) et donc 0 


n! n>oœ 


En effet l'exemple précédent, dans le cas a = 4, montre 


que sr converge vers 0; or si on a une suite u„ qui tend 
vers 0, et si 0 < v„ < up, alors v, tend aussi vers 0. Vérifiez 
ceci à partir de la définition, puis habituez-vous à faire ce 
genre de petit raisonnement rapidement. 


voir les exercices 
519,505, 524 


COMBINER LES LIMITES 
oM] 


Les exemples précédents sont presque les seuls pour les- 
quels vous verrez un € cette année. La quasi-totalité des suites 
que l’on va rencontrer vont être des combinaisons de ces li- 
mites, pour lesquelles on va appliquer le résultat suivant. 


ProposirioN 3.10 — Soient (un)n>0 et (Vu)n>o deux suites. On sup- 
pose que un, => € et que v, —> l’. Alors on a : 
n— co ñ—>00 


1. (somme) u, +v, — b+ l; 
n->o0 


2. (produit) u,v, man tb 


1 1 
3. (inverse) — => = lorsque € + 0. 
Uy nc € 


Avant de donner la démonstration, montrons un petit ré- 
sultat intermédiaire : 


Lemme 3.11 — Toute suite qui converge est bornée. En d'autres 
termes, si (Un)n>0 admet une limite, alors il existe un nombre C 
tel que pour tout entier n, on a [u,| < C. 

De plus, si la limite est > 0, alors il existe une constante p > 0 
telle que u, > p pour tous les n assez grands. 


Démonstration. Soit € la limite. On écrit 
[un] = (tn =£) + £| < lun — +161. 


Soit € > 0, par exemple e = 1. Il existe un entier N, tel que pour 
tous les n > N,, on a |u, — £| < e. Il suffit alors de prendre C 
plus grand que € + |£], et plus grand que tous les nombres [u„] 
pour n < N, (qui sont en nombre fini). 

Si maintenant € > 0, posons € = A Pour n > N, on a lu„ -£l < 
g, ce qu'on va réécrire 


l 
 Q =E-E<Un SRE 


On peut donc prendre p = € = £. 


Démonstration de la proposition. Commençons par la formule 
pour le produit. Une astuce que vous reverrez souvent est 
d'écrire uyvy — EC’ = u„(v„ — C’) + C(u, — £). Par suite 


vs =EL < [Un] [vn = C'I WI lus = £l. (*) 
Soit donc € > 0. Par hypothèse il existe N, tel que 
lu, =-€| <€ (1) 
dès que n > N; ; de même on a un N; tel que 
|\v„ -€| <€ (2) 


dès que n > N3. 

Si nous prenons N, n'importe quel nombre à la fois plus 
grand que N; et plus grand que Nz, alors on a à la fois (1) et 
(2) lorsque n > N.. Prenons une constante C comme dans le 
lemme. Alors en reportant ces inégalités dans (*), on aboutit à 


[unv„ -ELI < (C+ pour n>N:;. (**) 


Avec l'habitude, vous vous rendrez compte que ce genre d'ar- 
gument est suffisant, et que l'on a essentiellement déjà montré 
que u„v„ a pour limite {£’. Pourquoi ? 

Simplement parce que pour tout € > 0, on vient de mon- 
trer que l'on sait trouver N, tel que l'inégalité (**) est valable. 
En particulier on peut faire ce travail pour ë = on donc il 
existe N; tel que pour les entiers n > N; on a effectivement 


uv, 61 < (C +|EN) Ë = €. 


Vous montrerez la formule pour la somme sur le même mo- 
dèle, en plus facile. 

Pour l'inverse on écrit 
1 1 
Un € 


ai 
plél 


où p est comme dans le lemme (appliqué à la suite [u„] qui 
converge vers |£| > O (vérifiez-le)). Ainsi pour tout € > 0, on 
trouve un N, tel que pour n > N, on a 


l-u, 


lun- £l, 


Unt 


-al< 
Un € elel 


Là encore, c’est suffisant pour affirmer que | converge vers 1. 
u a 
n 


ExEMPLE 3.12 - Voyons comment cette proposition nous 
simplifie la vie. Admettons que l'on souhaite connaitre la 
limite de 


4n2+1 
Uy = >= =` 
Sn‘ -n+2 
On commence par diviser par n? au numérateur comme au 
dénominateur : 
4+ L 
U,, = n 
n 1, 2 
date 


1 _ 0. Grâce à la for- 


n 
mule pour le produit, on sait désormais que L = (EE) 


On a vu dans l'exemple 3.7 que 


converge également vers 0x0 = 0. De même 34 —2x0=0 


et -1 — (-1) x 0 = 0, encore par la formule pour le produit. 

Maintenant, la formule pour la somme nous dit que 4+ 
+ > 4 et que 5- 1 + 24; > 5 # 0. On peut donc utiliser la 
formule pour l'inverse qui donne finalement 


4 
Un => =. 
no 5 


voir les exercices 
507, 563, 568 


SUITES CROISSANTES ET DÉCROISSANTES 
l 


DériniTIoN 3.13 - On dit que la suite (un)n>0 est croissante 
lorsque u„ < u,,1 pour tout n; on dit qu'elle est décroissante 
lorsque u,,,1 < Un. 

On dit que (u,) est majorée lorsqu'il existe M € R tel que 
Un < M, pour tout n ; on dit qu'elle est minorée lorsqu'il existe m 
tel que m < Un. 


THÉORÈME 3.14 - Toute suite croissante et majorée est convergente. 
Toute suite décroissante et minorée est convergente. 


La démonstration va faire appel à la notion de borne supé- 
rieure, introduite dans le chapitre « Nombres ». Pour ceux qui 
n'ont pas lu ce chapitre, précisons que le théorème 3.14 (que 
vous allez devoir admettre) est essentiellement équivalent à ce- 
lui qui affirme que les bornes supérieures existent dans R. En 
d'autres termes, presque à chaque fois qu'une démonstration 
reposera sur une utilisation de sup, on pourra la réécrire diffé- 
remment avec des suites monotones. 


Démonstration. Soit (u,),>9 une suite croissante et majorée. On 
pose 
€=sup{u,;|neN}, 


ce qui a un sens puisque cet ensemble est majoré par hypo- 
thèse. 

Soit £ > 0 et considérons €” = € - e < €. Alors l’ ne peut pas 
être un majorant de l’ensemble ci-dessus, puisque £ est le plus 
petit. Ce qui revient à dire qu'il y a au moins un élément de 
l’ensemble, disons uy, tel que uy >”. 

Or la suite est croissante, donc u„ > uy > €” pour tous 
les n > N. On a donc € - e€ < u„ < € pour ces valeurs de n, et 
finalement |u, — £| < £. On peut donc prendre N; = N et la suite 
converge vers le sup de ses valeurs. 

Si (u,) est décroissante et minorée, on applique le résultat 
ci-dessus à (-u„), qui est croissante et majorée. 


ExEMPLE 3.15 - Voici une deuxième façon, plus facile, de 
monter que a” — 0 lorsque 0 < à < 1. Posons u„ = a". 
Alors “uel = à < 1, donc u,,1 < u, : la suite est décrois- 
sante. Tous les termes sont > 0, donc elle est minorée. Par 
le théorème, (4,) admet une certaine limite €. Montrons 
que £ = 0. 

Soit v, = a"t:. D'un côté nous avons v, = aa" = au„. 
Par la formule pour les produits de suites, on en dé- 
duit v, = af. 

n— co 


n+1 


D'un autre côté, nous avons Vy = u,,1. Il est donc 
clair que v„ a la même limite que u„ puisque c’est la 
même suite avec simplement les termes décalés d’un cran. 
Donc v, => £. 

n >o 


On doit donc avoir € = af. Si on avait € + 0, on en dé- 
duirait aœ = 1, ce qui contredit les hypothèses. Donc £ = 0. 


voir les exercices 
569, 572, 574 


CONVERGENCE VERS +00 
[EEE "| 


DÉFINITION 3.16 — On écrit 


Un — +œ ou lim u, = +0, 
n= o0 n— oo 
lorsque la condition suivante est remplie. Pour tout M > 0, il 
doit exister un entier N = Ny tel que u„ > M pour tous les 
entiers n > N. 
De même on dit que u„ > —- lorsque pour tout m < 0, il 
existe un entier N = N,, tel que u„ < m dès que n > N. 


En d’autres termes, quand u„ — +œ les termes de la suite 
deviennent arbitrairement grands lorsque les indices sont suf- 
fisamment grands. 

Les exemples vont provenir du résultat suivant. C’est une 
variante de la proposition 3.10, mais les choses ne marchent 
pas aussi bien. 


ProposirioN 3.17 — Soient (u,)1>0 et (Vn)n>o deux suites. On sup- 
pose que u, —— +œ et que v, —— €, où l’on peut avoir aussi 
ñ—>00 f—>00 


bien € ER que € = +œ. Alors : 
1. (somme) si €  —-co alors u„ +V, > +0; 
2. (produit) 


(a) si € > 0 alors u„v„ = > +00, et 
n >o 
(b) si € < O alors u,v, => -œ ; 
N=>co 
3. (inverse) 


il 
0 
Uy nœ 


f ; 1 
(b) si € =0, et si Yn on a v, > 0, alors — ——> +; 
Vy n >co 


P ; 1 
(c) si € =0, et si Yn on a v, < 0, alors — => -œ. 
Vy 100 


Vous montrerez cette proposition à titre d'exercice. Avant 
de passer aux exemples, notons que tous les cas ne sont pas 
couverts par ce dernier énoncé : que dire de u, +v, lorsque € = 
-0œ ? Que dire de u„v„ lorsque £ = 0? Réponse : rien en géné- 
ral. On dit que ce sont les « formes indéterminées ». Toutes les 
situations sont envisageables. 


ExEMPLE 3.18 - Puisque 4 => 0 pour tout entier k , le 
n* n= 


k 


3(b) de la proposition nous dit que n è +00. On peut 


évidemment vérifier très facilement ceci à partir de la dé- 
finition. 

De la même manière, p” => +0 si B > 1 : en effet po- 
sons œ = Ê < 1, alors a" — 0, et on applique encore le 3(b). 
Toujours pour les mêmes raisons, on a n! > +œ. 

Enfin, nous avons vu un exemple de forme indétermi- 
née dans l'exemple 3.12, en l'occurence une « forme 2 ». 
Nous avions montré dans ce cas précis qu'il y avait bien 
une limite, à savoir 5. 


Il y a certaines formes indéterminées que l'on peut ré- 
soudre, et il est utile d'en mémoriser quelques-unes au fur et 
à mesure qu'on les rencontre. En voici une première, « l'expo- 
nentielle l'emporte sur les puissances de n » : 


Lemme 3.19 — Soit a un réel tel que 0 < a < 1, et k un entier. Alors 


nka" = >0. 
n> 


Démonstration. C'est une forme indéterminée du type « +00 x 
0 ». Soit u, = n*a". On fait l'estimation suivante : 


Hud t L G 2 


Un n n> 
Prenons ë = La > 0; alors pour tous les n > N, pour un cer- 
tain N = N., on a 
a+1 
a-e< "H <are===<1 
Un 2 


En posant p = at, on voit d’abord que un;1 < puy ; puis UN42 < 


PUN+1 < puy ; et une récurrence nous mène immédiatement à 


n 
UN+n < P UN; 


pour tous les n > 0. Comme p"uy => 0 (le terme uyn n'est 
h—00 


qu'une constante !), on en déduit bien que u„ converge vers 0. 


Dans le même genre, « factorielle l'emporte sur l’exponen- 
tielle » : 


Lemme 3.20 — Soit a un réel tel que 0 < a < 1. Alors 


1 


an! n—00 


Démonstration. Posons u, = A4. Alors 


Un+1 _ 1 0 
Un a(n+1) n>œ `” 


donc u„;1 < Un pour n suffisamment grand. La suite (u„), qui 
finit par être décroissante et minorée, converge vers € > 0. Or 


si € > 0, on aurait 
u € 
n+1 


= 1, 


U„ n=% e 


une contradiction. 


- Fin de la première lecture — 


CONVERGENCE ABSOLUE 


Partant d’une première suite (4,),>0, on peut considérer la 
«série de terme général 4, », c’est-à-dire la suite 


n 


Un=0Çg+a+az+ +4 =>) ak. 
k=0 


(Cf. l'exemple 3.5.) 

Le théorème suivant peut paraitre surprenant : il dit que 
pour montrer la convergence de u„, il suffit de montrer la 
convergence de la série de terme général |a„| : 


Démonstration. On pose 


r ) leu ët u= ne 


k=0 


Par hypothèse S„ — €. Soit € > 0, alors pour tous les n suffisam- 
ment grands on aura |S„ - €| < 5, et donc 


[Sn — Sml = (Sn - €) +E- Sm)l < |S„ - €| Sme- £l < € 


lorsque n et m sont tous les deux supérieurs à un certain N. On 
en déduit pour la suite (u„) que 


n 


n 
[Un — uml = ` ax] < Y. lap] =S„-Sm <€, 


k=m+1 k=m+1 


lorsque n > m > N. On dit souvent que (u„) est une suite de 
Cauchy pour exprimer cette propriété (à savoir que [u,-u,,| < € 
pour n et m suffisamment grands). La fin de la démonstration 
va établir qu'une suite de Cauchy de nombres réels converge 
toujours. 

En effet, soient 


An =inf(up|k>n])] et B„=supluc|k2 n}, 


de sorte que a, < Un < Bn. Par construction la suite a, est 
croissante et majorée ; donc elle admet une limite €, d'après le 
théorème 3.14. De même fP„ converge vers une limite £, parce 
qu'elle est décroissante et minorée. 

Mais nous avons montré que pour tout € > 0, il existe un 
rang N au-delà duquel |u, - uyn] < €; pour ces valeurs de n, le 
nombre u, est dans l'intervalle ]Jun—e; uyn +el de longueur 2e, et 
on en déduit que B, - a, < 2e pour n > N. Ceci montre que b,- 
an > 0 et donc que f; = £2. Finalement l'encadrement ap < 
Un < Bn garantit que u„ converge également vers cette limite. 


Notez bien que la démonstration ne dit pas du tout com- 
ment calculer la limite de } ap, même si on connaît la limite 
de }_ laxl. Notez également que ce théorème serait faux si on 
travaillait sur Q; d’ailleurs la démonstration utilise des bornes 
supérieures et inférieures, qui sont propres à R. 

Dorénavant, nous utiliserons la notation suivante, plus sug- 
gestive, pour les limites de sommes. On écrit : 


+00 

> ap = lim ak, 
n— co 

k=0 


lorsque cette limite existe. 


EXEMPLE 3.22 (L’EXPONENTIELLE) - Soit x € R fixé. Posons 


n xk 
un =) —. 
k! 

k=0 


Montrons que cette suite converge absolument. Nous de- 
vons donc montrer que 


admet une limite. La suite (S„) est croissante, donc d’après 

le théorème 3.14 il suffit de montrer qu’elle est majorée. 
Pour k suffisamment grand, disons k > K, on a |x| < k; 

on peut même choisir œa < 1 tel que nl < a pour k > K. On 


a alors 
RE >> Jx] Tx > 1 


LR . <a =À. 
(K+1)! ` K+1 KI `" TKI 


De même on a 


RÉ - ki. RÉ z HIS? 2 M 
(K+2)! K+2 (K+1)! (K+1)! K! ` 
Par récurrence on obtient 
|x K+ z at lx]K 
(K+ k)! K! ` 


Ceci va nous suffire, puisqu'en posant C = Sg-ı on peut 
écrire pour n > K : 


n-K 
_ |x | K+k 
Sn = C+) +R 
lx] 
! 


|x]K j= a”+!1-K 


= C+<=- 
K! 1-a 
RÉ 1 
< C+=--. 
z K! 1-a 


La suite (S„) est donc bien majorée en plus d’être crois- 
sante, elle est donc convergente ; par suite (u„) est absolu- 
ment convergente, et donc elle-même convergente d’après 
le théorème. Sa limite, qui dépend de x, est notée exp(x) 
ou e*, et appelée l’exponentielle du nombre x. En clair 


k 


DE. 


Cette définition de l’exponentielle coïncide, heureuse- 
ment, avec les définitions qui vous sont esquissées au lycée. 
Nous montrerons ça en temps voulu. 


ExEMPLE 3.23 - Certaines séries convergent, mais sans 
converger absolument : il faut donc faire attention. Par 
de nous pourrons montrer plus loin que pour aç = 
C1 
ET D , la série converge et on a même 


+00 


(-1)* ïL T L.A 
=J= - = In(2). 
Li a on 


Par contre en prenant les valeurs absolues, nous montre- 
rons que l’on a en fait 


c'est-à-dire qu'il n’y a pas de limite finie. 


voir l'exercice 
570 


SUITES DE COMPLEXES 


Lorsque l’on se donne pour chaque entier n un nombre 
complexe z„ = 4, + ib,, et lorsque a, > €, et b, > 43, on dit 
que (Zn)n>0 converge vers € = {1 + il, et on note z, —— €. Par 

A nœ 


exemple 

3n? = 2n+5 , 2i 

=_@Â\+++sz=i — =. 

2" 7n-12 n>% 7 
Cette définition a le mérite d’être simple. Cependant on peut 
donner une définition plus directe, sans référence aux suites 
réelles, en remplaçant simplement les valeurs absolues par les 
modules ; en clair : 


ProposiTION 3.24 - La suite (z,),>0 converge vers € exactement 
lorsque la condition suivante est remplie. Pour chaque réel € > 0, il 
doit y avoir un entier N, tel que |z„ — £| < ë dès que n > N,.. 


Ici |z, — €] est le module du nombre complexe z, — £. À part 
ça, la condition est la même que pour les suites réelles. 


Démonstration. Écrivons z, = a,+ib,. Pour commencer, suppo- 
sons que 4, — €; et b, > £2. Étant donné e > 0, on trouve Ni tel 
que |a„ — 44| < € pour n > N;, et de même pour tous les n plus 
grands qu'un certain entier N, on a |b„ —£,| < £. Lorsque n est à 
la fois plus grand que N, et que N;,,on a 


lep = (@ +502) = flan 4 + (bu = 63)? < Ve? + < Ve. 


2 


v2 


Ceci montre bien (en recommençant avec ë = +) que la condi- 


tion donnée est remplie pour € = {3 + ilz. 

Réciproquement, supposons cette condition remplie pour 
un certain € = (1 +it€2, et étudions la convergence des suites (4,) 
et (b,). Soit e > 0. En notant simplement que 


lan — Lil < |z„ — £l, 


on constate que si |z„ — £| < e, alors [a, — {| < €, et ceci établit 
que an > £4, clairement. De même (b,) converge vers 22. 


La convergence absolue fonctionne encore avec les com- 
plexes : 


Démonstration. Écrivons z, = a, +ib,. On a |a,| < |z„| et donc 


n T +00 
Sy = ) la < Y lz < Y lei. 
k=0 k=0 k=0 


La suite S„ est donc majorée. Elle est visiblement croissante, 
donc elle converge. D'après le théorème 3.21, on en déduit 


l'existence de 
+00 


F a 


k=0 


de même on montre l'existence de 


+00 
Fu 
k=0 
Mais bien sûr on a 
n n. n n 
teli aly a Xa) ne. 
k=0 k=0 k=0 k=0 


Puisque ses parties réelles et imaginaires convergent, c'est bien 
que la somme elle-même converge. 


ExEMPLE 3.26 (L'EXPONENTIELLE COMPLEXE) - Soit z € C fixé. 


On pose 
1 k 
Z 
Un = ) =. 
k! 
k=0 


Soit x = |z|; c'est un nombre réel > 0, et on a montré dans 
l'exemple 3.22 l'existence de 


C'est donc que (u„) converge absolument. D'après le 
théorème, elle converge. La limite dépend de z, on la 
note exp(z) ou e”. En clair 


+œ _k 
k! . 

0 
Lorsque z = i0 avec 8 € R, la notation e!9 coïncide avec 
celle que vous connaissiez au lycée, comme nous le mon- 
trerons plus loin. 

Sur cet exemple on peut apprécier le secours qui nous 
est apporté par le théorème sur la convergence absolue : 


étudier les parties réelle et imaginaire de (u„) directement 
serait bien difficile. 


Pour travailler directement avec les complexes sans passer 
par les parties réelle et imaginaire, il nous manque encore un 
ingrédient : c'est la très utile inégalité triangulaire, que nous 
avons vue dans le cas de R dans le lemme 2.4. Elle reste vraie 
sur C: 


Lemme 3.27 — Si a et b sont des nombres complexes, on a 
|a + b| < la + |b], 


et 
[la] - [b|] < la — bl. 


Nous allons donner une démonstration très générale dans 
le paragraphe suivant (voir le lemme 3.31). 


SUITES DE VECTEURS 
(ne=r== ooc--= Tp... 0200004 


L'ensemble C des nombres complexes peut être identifié 
avec l'ensemble R x R, que l'on va noter R2, en voyant a+ 
ib comme la paire (a,b). De même, on peut considérer l'en- 
semble R x R x R des triplets (a,b,c) de nombres réels; on va 
noter cet ensemble R3. L'ensemble R* est composé des quadri- 
plets (a,b,c,d). 

Rien ne nous enpêche de continuer : étant donné un en- 
tier r, l’ensemble R” est constitué des « r-uplets » (a,b,c,d,...) 
(séquence de r nombres réels). Ces éléments sont appelés vec- 
teurs. 


DÉFINITION 3.28 - La norme (ou norme euclidienne) d’un vec- 
teur est : 


IlCa,b,c,d,...|= Va? +b? +c? +d? +-+.. 


En particulier, si z = a + ib, alors |z| = ||(a, b)||. La norme est 
donc une généralisation du module. 

Une suite de vecteurs est une fonction N > R”, c'est-à-dire 
que pour tout entier n on se donne un vecteur 


Tr 
Un = (ap Das Cas Ans.) ER. 
Exactement comme dans le cas des complexes, on a : 


PROPOSITION 3.29 — Soit u„ = (ay, by, Cn, dns...) une suite de vec- 
teurs de R". Les deux énoncés ci-dessous sont équivalents : 


1. Chacune des suites (an)n>0; (bn)n>o, (Cn)n>o, =... converge 
respectivement vers l1, Co, b3, ... 


2. Soit € = (£1,0,...,0,). Pour chaque réel € > 0, il existe un 
entier N, tel que pour n > N; on a ||[u, — {|| < €. 


Les démonstrations sont les mêmes que dans le cas des 
complexes, et sont laissées en exercice. Nous avons également : 


Lemme 3.31 — Si a et b sont des vecteurs de R", alors 
lla + bl] < llall + 11b]], 


et 


| llall = loll | < Île = bl. 


Montrons-le (ceci va établir le lemme 3.27 du même coup). 
Commençons par une inégalité célèbre : 


LEMME 3.32 (INÉGALITÉ DE CAUCHY-SCHWARZ) — Étant donnés des 
nombres réels x1, X2, ..., Xr» V1, V2, -Yn ON A: 


a 2 


Eu all 


i=1 Fil 


Supposons de plus que les nombres y1,v2,...,v, ne sont pas tous 
nuls ; alors cette inégalité est une égalité exactement lorsqu'il existe 
un réel t tel que x; + ty; = 0 pour tous les indices i à la fois. 


Démonstration. Si tous les y; sont nuls, les deux membres de 
l'inégalité sont nuls, et l'inégalité est donc satisfaite. On sup- 
pose maintenant qu’il ne sont pas tous nuls. 

Pour t € R, considérons 


, 
P(t)=>) (x;+ty;)? = AP +Bt+C, 
i=0 


A= y 2, B=2) xp, Ge) 3% 
i=0 i=0 i 


Faisons quelques observation sur P(t). D'abord, puisque P(t) est 
une somme de carrés, on a P(t) > 0 ; de plus P(t) = 0 exactement 
lorsque x;+ty; = 0 pour tous les indices i à la fois. Par hypothèse 
il y a un indice ig tel que y;, + 0, donc une seule valeur de t au 
maximum peut convenir, à savoir t = Á. 


Concluons. Ou bien le polynôme P(t) a une racine réelle 
et une seule, et donc son discriminant B? - 4AC = 0; ou 
bien il n'a pas de racine réelle du tout, et donc son discrimi- 
nant B? - 4AC < 0. Étant données les valeurs de A, B et C, on a 


exactement ce que dit le lemme. 


avec 


Démonstration du lemme 3.31. Notons a = (x,,x2,...,x,) et b = 
(V1 Y2,...,vr). On calcule directement 


f: 


lla + b||? = Y (x +y;)? = llall? + [Jbl]? + 2(a, b), 
i=0 


avec 
F 


(a,b) = xii < llall- Ilb, 


i=0 


d’après l'inégalité de Cauchy-Schwarz. Finalement 
lla + bll? < lall? + Ibl? + 2llall - Ibl] = (lall + IBI)? - 


Ceci montre la « première » inégalité triangulaire ||a+ b|| < [|al| + 
|b|]. La deuxième se déduit de la première, exactement comme 
dans le corollaire 2.5. 


On en déduit enfin : 


LEMME 3.33 — Si (u,)1>0 est une suite de vecteurs de R" qui 
converge vers € € R", alors on a également 


llull — > Ill. 
n—oo 


Démonstration. On utilise la deuxième inégalité triangulaire : 
[IEM = Ne„ll] < IE- ul. 


Le membre de droite tend vers 0 d'après le (2) de la proposi- 
tion 3.29. 


voir l'exercice 
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Chapitre 4 


Continuite 


INTRODUCTION & DÉFINITIONS 
[PM] 


Une fonction continue, intuitivement, est une fonction que 
l’on peut dessiner sans lever le stylo, comme celle-ci : 


Ci-dessous, un dessin d’une fonction qui n’est pas conti- 
nue. On a même l'intuition, plus précisément, qu’elle n’est pas 
continue au point x, : 


FIGURE 4.1 - Le graphe d'une fonction qui n’est pas continue en xo. 
Les crochets sont simplement là pour indiquer que la valeur de la 
fonction au point xg est celle indiquée sur la branche droite du 
graphe. 


Pourquoi s'intéresser aux fonctions continues ? La propriété 
cruciale d’une fonction continue est la suivante : puisque le 
graphe est tracé d’un seul tenant, alors si la fonction prend 
des valeurs positives et des valeurs négatives, on est sûr qu’elle 
prend également la valeur 0. Sur le premier graphe ci-dessus, 
la fonction est d’abord positive, puis prend quelques valeurs 
négatives ; et bien sûr elle passe par la valeur 0 (comment évi- 
ter cela si on ne peut pas lever le stylo ?). De même, puisque 
cette fonction reprend des valeurs positives, elle s’annule une 
deuxième fois. 

En d’autres termes, si l’on sait qu’une fonction f est conti- 
nue, alors on peut prédire l'existence de solutions de l’équa- 
tion f(x) = 0. De nombreuses équations qui nous concernent 
peuvent se mettre sous cette forme, donc la notion de conti- 
nuité va être très utile. 

Oui mais comment traduire mathématiquement l’idée de 
continuité? Il y a plusieurs façons de le faire, toutes assez 
abstraites au premier abord, et nous devrions avoir un seul 
critère pour juger du bien-fondé d’une définition : elle doit 
nous permettre de démontrer rigoureusement la propriété ci- 
dessus. Nous allons prendre la définition qui nous paraît la 
plus simple, et nous allons effectivement démontrer le célèbre 
« théorème des valeurs intermédiaires », qui en est la version 
précise. 


DÉFINITION 4.2 — Soit I C R, et soit f: I > R une fonction. 
On dit que f est continue au point x € I lorsque, pour toute 
suite (4,)1>0 qui converge vers xo, la suite (f(u,)),>9 converge 
vers f (xg). 

Lorsque f est continue en tout point xọ € I, on dit tout sim- 
plement qu'elle est continue sur I. 


(La lettre I est pour «intervalle », puisque la plupart de nos 
exemples sont sur un intervalle, et certains théorèmes ne fonc- 
tionnent que dans ce cas; ceci dit, en toute généralité I peut 
être n'importe quoi.) 

Voyons un exemple : 


Lemme 4.3 — Soit P € R[X] un polynôme. Alors la fonction x + 
P(x) est continue sur R. 


Démonstration. Soit donc une suite (u,),-0 telle que un > xo. 
Puisque P est un polynôme, la suite (P(u„)) est obtenue à 
partir de (u,) en faisant une série d’additions et de multi- 
plications. Les limites de suites sont « compatibles » avec les 
sommes et les produits, comme la proposition 3.10 nous l’af- 
firme, donc P(u,) => P(xo). Ce qui signifie par définition 


que P est continue. 


ExEMPLE 4.4 -Le premier graphe de ce chapitre est ce- 
lui de x + xt + x? =x? — 5x + 1. Dire que cette fonc- 
tion est continue en x, revient à dire que, si u, > Xo, 
alors uf +u2-u2-5u„+1 > x$ +x- x3 -—5xo+ 1, ce qui est 
clair. Le dessin a été obtenu à l'aide d'un ordinateur, qui 
procède à toutes sortes d'approximations pendant le tracé, 
donc on ne peut pas conclure grand-chose de l'aspect de 
ce graphe. Toutefois, il est rassurant que le résultat ne soit 


pas contraire à notre intuition des fonctions continues. 


ExEMPLE 4.5 - Voici un exemple de fonction qui n'est pas 
continue. Définissons f sur l'intervalle [0,2] par : 


Osix<1 
re | 1six>1. 


Le graphe de f fait donc un « saut » autour de la valeur 1. 


Pour montrer que f n’est pas continue, on va considérer la 
1 


suite u, = l- ;. On a bien u„ > 1, mais f(u,) = 0 pour 


tout n, donc (f (u„)) ne risque pas de converger vers f(1) = 
1. Par définition, f n’est pas continue. 


LE THÉORÈME DES VALEURS INTERMÉDIAIRES 
(na=rmc==co 0775500200257850 


Avant d'énoncer ce théorème, un petit rappel sur les inter- 
valles. Jusqu'à présent nous avons utilisé le mot « intervalle » 
en nous basant sur les souvenirs du lycée. Voici une définition 
simple : 


DÉFINITION 4.6 -Soit I C R. On dit que I est un intervalle 
lorsque, pour tous nombres a, b et c tels que a < b < c avec a E Ï 
et cE T, on a aussi b E I. 


ExEMPLE 4.7 - On a les exemples suivants : 
o Les intervalles ouverts, de la forme 


]a, bl=(x|a<x < b}, 


avec a, b € R ou même a = —o, b = +œ. 
o Les intervalles fermés, qui peuvent être « compacts », 
c'est-à-dire de la forme 
[a,b]={x|a<x<b} aveca,beR, 


ou bien « non-compacts », c'est-à-dire de la forme 
[a,+oo[ ou ]-0œ,b]. 
o Les intervalles semi-ouverts, qui sont de la forme 
Ja,b] ou [a,b]. 


En fait, cette liste est complète. Vous montrerez à titre 
d'exercice que tout intervalle I est de l’un des types ci- 
dessus, et que de plus a = infI et b = sup, lorsque l’une 
ou l’autre de ces bornes existe. 

Voyons un contre-exemple. L'ensemble 


I=[0,1]U [3,4] 


n'est pas un intervalle. D'abord, il n’est pas dans la liste ci- 
dessus, et surtout on voit tout de suite que 1 € I, que 3 €I 
mais que 2 ¢ I, ce qui contredit bien la définition. 


Nous pouvons maintenant énoncer : 


THÉORÈME 4.8 (THÉORÈME DES VALEURS INTERMÉDIAIRES) — Soit I 
un intervalle, et soit f : I — R une fonction continue. Soient a < b 
deux éléments de I. Alors si y est un nombre quelconque compris 
entre f(a) et f (b), il existe (au moins) un nombre x avec a < x < b 
tel que f(x) = y. 

(En d'autres termes, l’image d’un intervalle par une fonction 
continue est encore un intervalle.) 


Démonstration. On va donner deux démonstrations, en com- 
mençant par un argument « avec des sup ». Supposons par 
exemple que f(a) < f (b), de sorte que f (a) < y < f (b). Posons 


A=[t]a<t<bet f (t) < y). 


C'est un ensemble non-vide (a € A) et majoré (par b), donc il 
possède une borne supérieure x = sup A. 

Soit n un entier > 1. Considérons le nombre x- 1 < x. Ce 
n'est pas un majorant de A (puisque x est le plus petit), donc 
il existe t„ € À avec x- 1 < t„ < x. On a t„ > x. La fonction f 
étant continue, on a également f(t„) > f(x). Puisque f (ta) < y, 
on a f(x) < y. 

On va maintenant établir que f(x) > y, ce qui est d'ailleurs 
évident si x = b, et on se place donc dans le cas x < b. Le 
nombre s„ = x+ Í > x ne peut appartenir à A, et s„ € [a,b] 
pour n suffisamment grand; donc f(s„) > y. On a s„ > x et, 
par continuité de f, il vient f(s,) > f(x), d’où f(x) > y. 

Voici maintenant une deuxième démonstration, à l'aide 
de suites monotones. On suppose toujours qu'on est dans le 
cas f(a) < f (b), et on va construire par récurrence deux suites 
(4n)n>o et (by)1>0 telles que (a„) est croissante, (b„) est décrois- 
sante, f(a„) < y < f(b„), et enfin b, -a„ — 0. À cette fin, on 
pose 4 = a et bọ = b pour commencer. Ensuite, en supposant 
que l’on a défini les nombres 4, et b„ pour un certain n, on 
pose m = Antb, et deux cas se présentent : ou bien f(m) < y et 
on pose dy+1 = M, bn+1 = bn, ou bien f(m) > y et on pose 4,,1 = 


n”4n 


an, bn+1 = M. Dans les deux cas, on a b,,1 - Aysa = Pneu et en 
particulier b„-4a„ = 20740 — 0. Toutes les propriétés annoncées 
sont alors évidemment vérifiées. 

D'après le théorème 3.14, la suite (a„) possède une limite £4, 
et donc f (a„) > f (£1) car f est supposée continue. L’inégalité 
f(a„) < y donne f(£1) < y. De même la suite (b,) possède une 
limite l% et f) > y. Or b,-a, > 0 = b - l1, d'où 4 = b, 


et f (£1) = f (£2) = y. 


Notez bien que x n’est pas unique en général. Sur le dessin 
suivant on a représenté les éléments de la première démons- 
tration, et on voit qu'on avait trois choix dans ce cas pour x, 
celui retenu étant le plus grand. La zone située entre la courbe 
et l’ensemble A a été grisée. 


f (b) 


ExEMPLE 4.9 (RACINES n-1ÈMEs) - Prenons l'exemple de la 
fonction f: [0,+co[— R définie par f(x) =x", pour un en- 
tier n. C'est une fonction polynomiale, donc continue. 

Prenons un nombre réel y > 0, et choisissons un 
nombre b tel que b" > y. On a donc f(0) < y < f(b), et 
le théorème des valeurs intermédiaires affirme donc l’exis- 
tence d’un x tel que f(x) = y, c'est-à-dire x" = y. On 
constate que tout nombre réel positif possède une racine n- 
ième. 

De plus, si 0 < xı < x2, on a xï < x}; cette remarque 
simple entraîne l'unicité du x > 0 tel que x” = y. La ra- 
cine n-ième positive de y est bien définie, on la note {/y. 

Nous avions démontré ce résultat pour n = 2, avec pas 
mal d'efforts (proposition 2.10). Le théorème des valeurs 
intermédiaires, maintenant qu'il est démontré, simplifie 
considérablement ce genre de questions. 

Il nous reste à considérer les racines n-ièmes dans C, ce 
qui nécessite de nouveaux outils. 


AUTRES EXEMPLES DE FONCTIONS CONTINUES 
a aama aara] 


Les fonctions « usuelles » sont toutes continues : 


ProposiTION 4.10 - Les fonctions suivantes sont continues en tout 
point de leur domaine de définition : 
o x e* sur R, 
x => sin(x) sur R, 
x => cos(x) sur R, 
x> tan(x) sur Rx (5 + km avec k € Z}, 
x => ln(x) sur ]0, +œ], 
x => arcsin(x) sur [—-1,1], 
x => arccos(x) sur [-1,1], 
x => arctan(x) sur R, 
xt Vx sur [0,+co[ pour n EN. 
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Pour l'instant, on ne risque pas de donner une démonstra- 
tion de cette proposition : on n'a même pas de définition rigou- 
reuse de la plupart de ces fonctions ! Toutefois, dans le reste de 
ce chapitre, on va établir que x H> 1/x est continue, et nous ver- 
rons également qu'il suffit de montrer la continuité des quatre 
premières fonction dans la liste ci-dessus pour obtenir automa- 
tiquement la continuité des autres. Grâce à certaines formules 
de trigonométrie qu'il faudra établir et que vous devinez peut- 
être, on se ramènera à montrer seulement la continuité de l'ex- 
ponentielle. Pour cela, on travaillera directement avec la défi- 
nition donnée dans l'exemple 3.22. Nous traiterons ceci dans 
l'appendice intitulé « L'exponentielle ». 

Pour construire encore plus de fonctions continues, on uti- 
lise le résultat suivant : 


ProposiTIOoN 4.11 — Soient f et g deux fonctions définies sur I et 
continues en xg € I. Alors 

© (somme) x > f(x) + g(x) est continue en xo, 

© (produit) x => f(x)g(x) est continue en xo, 

© (inverse) si f(x) # O sur I, alors x > T est continue en xp. 


En effet, ceci découle directement de la proposition 3.10. 


ExEMPLE 4.12 - Si l'on admet que le sinus et le cosinus sont 
des fonctions continues, alors 


sin(x) 


x => tan(x) = EE) 


est également continue là où elle est définie, c’est-à-dire là 
où le cosinus ne s’annule pas. 


Par rapport aux suites, une nouveauté très simple : 


Prorosition 4.13 — Soit f : I — J continue en xp E I, et soit g: J > 
R continue en f(x ) € J. Alors la fonction g o f : Ï > R, qui à x 
associe g( f (x)), est continue en xp. 


Démonstration. Soit donc (u,);>0 une suite convergeant 
vers x Í. Posons v, = f(u„). La suite (v,) converge vers f(xo) 
car f est continue en xp. La suite (g(v„)) converge vers g(f(xo)) 
car g est continue en f (xo). Donc go f, par définition, est conti- 
nue en xp. 


ExEMPLE 4.14 - Considérons une expression comme 


ecos(x) _ In(x) 


> i 
1 + (arctan (x))? 


Les propositions ci-dessus permettent d'affirmer en un clin 
d'œil que cette fonction est continue sur ]0,+00[. En effet, 
commençons par 


x> 1 + (arctan(x))?; 


la fonction arctan est continue (4.10), donc son carré aussi 
(4.11); la fonction constante égale à 1 est continue, donc la 
somme 1 + (arctan(x))? est continue (4.11 encore). 

Ce dénominateur ne s’annule pas, donc 


1 
x => 
1 + (arctan(x))? 


est continue (4.11). 

Ensuite x + e%U) est continue puisque c'est une com- 
position de fonctions continues (4.13); l'expression x H> 
—In(x) est le produit du logarithme et de la fonction 
constante égale à -1, c'est donc une fonction continue. La 
somme des deux aussi : le numérateur est continu. 

Enfin, toute l'expression de départ étant le produit de 
deux fonctions continues, il est continu. 

Il faut s'entraîner à reconnaître très vite que ce genre 
d'expression donne une fonction continue. 


voir les exercices 
642, 649, 671, 
645 


LE LANGAGE DES LIMITES 
—_—_————————— €= 


DérinirioN 4.15 - Soient f : I > R une fonction et xọ € R, ou 
même xp = +co. On dit que f admet € pour limite en x Ü, et on 


note 
lim f(x) =ê, 


X>Xq 


lorsque pour toute suite (u,),>0 qui converge vers xo, avec u, € 


I, la suite (f (u„)) converge vers £. 


Dans un premier temps, cette notion apparait comme une 
reformulation de la continuité, notamment à cause du résultat 


suivant : 


Proposition 4.16 - Soient f : Ï > R et x Ó € I. Alors 
f est continue en xg > f admet une limite en xo. 


De plus, la limite est automatiquement f (xp). 
Démonstration. Si f est continue en x, alors par définition 


lim f(x) = f (xo), 


XX) 


donc on a l'implication =. Pour montrer =, supposons que f 
admette la limite € en xp. Il suffit de prendre la suite constante 
Un = xo pour constater que (f(u,)) converge vers f(xo) (cette 
suite est elle-même constante). Donc € = f (xg). Il est alors clair 


que f est continue en xp. 


Mais il ne faut pas s’y méprendre. Les limites apportent une 
souplesse nouvelle, puisque l’on ne suppose pas que f est définie 


en xo dans la définition des limites. Voyons des exemples. 


ExEMPLE 4.17 - Considérons la fonction f : ]0,+co[— R dé- 
finie par f(x) = À. 

Regardons la limite en 0. Si (u,)1>0 converge vers 0 
avec u, dans le domaine de définition de f, c'est-à- 
dire u„ >0,ona f(u,) = — +00. C’est donc que 


lim f(x) = +00. 
x—0 


Le même raisonnement donne 


lim f(x) = 0. 


X— +00 


En fait le graphe a l'allure suivante : 


L'exemple suivant illustre ce qu’on appelle le « prolonge- 


ment par continuité ». 


ExEMPLE 4.18 — Soit f : R x {0} > R définie par 


1 
f(x) = xsin(=). 
Cette fonction est continue en tout xp + 0 comme on le voit 
facilement à partir des résultats ci-dessus. 
Regardons la limite en 0, donc prenons (u„) qui tend 
vers 0 avec u„ + 0. Alors |f (u„)| < |u,| puisque [sin(;)l < 1. 
On en déduit f (u„) > 0, et donc 


lim f(x) = 0. 


x—0 


Définissons alors 


fe =| fix)sixz0, 


0 sinon. 


Les fonctions f et f ont la même limite en tout point xp € 
R (prenez le temps de vous en convaincre). De plus cette 
limite vaut toujours f(xo). On conclut que f est continue. 

On dit que f prolonge f par continuité, puisqu'elle 
coïncide avec f sur le domaine de définition de cette der- 
nière, et qu'elle est continue. Vue la limite de f en 0, on 
n'aurait pas pu prendre une autre valeur pour f(0), donc 
le prolongement est unique. 

Voici le graphe de f sur [-0,2;0,2]: 


Pour l'instant nous ne sommes pas capables de calculer 
beaucoup de limites (pas plus qu'au lycée). Dans le chapitre 
« Formules de Taylor » nous verrons une méthode rapide et fa- 


cile, qui fonctionne dans beaucoup de cas. 


voir les exercices 
677, 675, 639, 
646 


CONTINUITÉ ET INÉGALITÉS 
[=M] 


Le résultat suivant est très utile. Il affirme que si une fonc- 
tion continue satisfait une inégalité en un point, alors ceci reste 
vrai au « voisinage » du point : 


ProposiTION 4.19 — Soit f : I > R une fonction continue en xo € I. 
On suppose que f (xo) > 0. Alors il existe un intervalle ouvert J = 
Ja, b| avec xo € J tel que f(x) > O pour tout xe JAI. 


Démonstration. On va même montrer qu’on peut prendre a = 
Xo— 1 et b = xo + É pour un certain entier n. En effet, si ce n'était 
pas le cas, par l'absurde on trouverait pour chaque n un x, EI 
tel que 


1 P 1 
Xy => x Xò + = 
0 n 0 n 
et tel que f(x„) < 0. La suite (x„) converge vers xp, et par 


continuité de f la suite (f(x„)) converge vers f(x O) : on en dé- 
duit f (xo) < 0 ce qui est absurde. 


En guise d'application nous allons montrer le théorème sui- 
vant, qui donne des définitions alternatives de la notion de 
continuité. Le (3) en particulier est utilisé dans de nombreux 
livres. 


Démonstration. Montrons que (1) > (2). L'intervalle J étant 
donné, il existe m et M tels que f(xo) €]m, M[c J. Soit alors 
g(x) = f (x) - m; c'est une fonction continue telle que g(xo) > 0, 
donc d'après la proposition précédente on a aussi g(x) > O 
pour tous les x € I dans un intervalle ]a,,b;[. De même en 
considérant h(x) = M - f(x), on obtient h(x) > 0 pour x e I 
dans un intervalle ]a2z,b2[. Sur Vintervalle T’ =J]a,,b1[N]a2, b2[, 
on a m < f(x) < M, donc f (T NT) c]m, M[C]. 

Montrons (2) = (3). Prenons J =]f (xo) -& f (xo) + el, alors 
le (2) donne un intervalle T’, qui lui-même contient un inter- 
valle de la forme ]xo — 8, xo + 8|. L'inclusion f (INT) cJ donne la 
conclusion du (3). 

Montrons (3) > (1). Soit donc (#,),>0 une suite d'éléments 
de I qui converge vers x, ; on doit montrer que (f (u„)) converge 
vers f(xo). On prend donc € > 0, et un ò comme dans le (3). 
Pour n suffisamment grand, on a |u, — xol < 6, et donc |f (u„) - 


f(xo)l < €. 


— Fin de la première lecture - 


voir l'exercice 
670 


CONTINUITÉ ET FONCTIONS MONOTONES 
aaa mm aal 


DÉFINITION 4.21 - Une fonction f est dite croissante lorsque, 
pour tout x et y dans son domaine de définition, l'inégalité x < 
y entraîne f(x) < f (y). Elle est dite décroissante si x < y entraîne 
au contraire f(x) > f(y). (Ainsi f ne peut être à la fois crois- 
sante et décroissante que si elle est constante.) 

On dit d’une fonction f qu’elle est monotone si elle est ou 
bien croissante, ou bien décroissante. 

Enfin, on parle de fonction strictement croissante lorsque x < 
y entraîne f(x) < f(y) (inégalité stricte cette fois), et de même 
on a les concepts de fonction strictement décroissante et stric- 
tement monotone. 


Nous verrons beaucoup d'exemples dans le chapitre sur la 
dérivabilité. Notons simplement que l’exponentielle est crois- 
sante, la fonction cosinus est décroissante sur [0, Tt], et la même 
fonction cosinus vue comme une fonction définie sur R tout 
entier n’est pas monotone. 

Le comportement des fonctions monotones vis-à-vis de la 
continuité est particulièrement simple. Commençons par une 
sorte de réciproque au théorème des valeurs intermédiaires : 


PropPosirioN 4.22 — Soient I un intervalle et f: Ï > R une fonc- 
tion monotone. Alors f est continue si et seulement si f(I) est un 
intervalle. 


Par exemple, la fonction sur la figure 4.1 est croissante. Elle 
n'est pas continue, et son ensemble image est en deux mor- 
ceaux. 


Démonstration. Le théorème des valeurs intermédiaires affirme 
que si f est continue, alors f(I) est un intervalle. Supposons 
que f est croissante et montrons la réciproque (le cas où f est 
décroissante est similaire). Prenons xo € I et supposons pour 
l'instant que f (xo) n’est pas une borne de l'intervalle f(I). 

Soit J un intervalle ouvert contenant f(x Í). Alors J N f(I) 
est un intervalle contenant f(x), donc contenant un inter- 
valle [m,M] avec m < f (xg) < M. Par définition m = f (a) et M = 
f (b) pour a, b € I. Comme f est croissante, on a a < xg < b d’une 
part, et d'autre part pour a < x < b on a m < f(x) < M. En po- 
sant Ï” =]a,b[C I, on a en particulier f(T’) C J. D'après le (2) du 
théorème 4.20, ceci montre que f est continue en xp. 

Lorsque f(x O) est une borne de f(I), on a m = f(x) ou M = 
f (xo), et selon le cas, f(xọ) est un minimum ou un maximum 
de la fonction croissante f. On peut adapter facilement la dé- 
monstration (laissé en exercice). 


Dans le reste de ce chapitre, nous aurons besoin des no- 
tions de fonction injective, surjective, et bijective (définitions 
1.6, 1.10, 1.13). 


ProposiTION 4.23 - Soient I un intervalle, et f : Ï — R une fonc- 
tion continue. Alors f est strictement monotone si et seulement si 
elle est injective. 


Démonstration. Si f est strictement croissante (disons), alors 
en prenant deux éléments x, # x) € I on doit avoir xı < x2 
ou x, < xı, donc f(x) < f(x2) ou f(x2) < f(x1) selon le cas, 
et certainement f (x1) # f (x2). Donc f est injective. 

Voyons la réciproque. Supposons que f est continue et in- 
jective, et prenons a € I. On va montrer que f est strictement 
monotone sur ]a,+œ[NI; comme a est arbitraire, on aura bien 
établi que f est strictement monotone. 

Soit g(x) = f(x) - f (a), que l’on voit comme une fonction 
définie sur l'intervalle IN]a, +o0[. Par injectivité de f, la fonc- 
tion g ne s’annule pas. D’après le théorème des valeurs in- 
termédiaires, elle ne peut pas changer de signe, donc disons 
par exemple que l’on a g(x) > O pour tous les x > a, c’est-à- 
dire f(x) > f(a). Dans ce cas on va montrer que f est stricte- 
ment croissante sur ]a,+co[Nl. 

En effet, si ce n'était pas le cas, on aurait deux valeurs b 
et c avec a < b < c telles que f(b) > f(c) (inégalité stricte par 
injectivité de f). Mais alors, prenons n'importe quelle valeur y 
telle que f(c) < y < f(b) et f(a) < y < f(b). En appliquant le 
théorème des valeurs intermédiaires sur l'intervalle [a,b], on 
trouve x, < b tel que f (x1) = y. En faisant de même sur [b,c] on 
trouve x > b tel que f(x2) = y. Ceci est absurde puisque f est 
injective. 


La fin de la démonstration est illustrée sur la figure sui- 
vante. 


l 
l 
l 
| 
| 
l 
l 
l 
| 
xı b X2 C 


See al 


THÉORÈME 4.24 — Soit f : Ï — J une bijection continue, où I et J 
sont des intervalles de R. Alors sa réciproque f~! est également 
continue. 


Démonstration. La fonction f étant continue et injective, elle 
est strictement monotone par la proposition précédente. Donc 
f! aussi. De plus f-!(J) = I, qui est un intervalle par hypo- 
thèse, donc f"! est continue d’après la proposition 4.22. 


ExEMPLE 4.25 - Lorsque nous aurons (enfin) montré que 
la fonction exponentielle est continue, nous déduirons du 
théorème ci-dessus que sa réciproque le logarithme est 
également continue. De même les fonctions arccosinus, 
arcsinus, et arctangente sont continues parce que les fonc- 
tions cosinus, sinus, et tangentes sont continues, comme 
nous le montrerons. 

Pour l'instant, nous pouvons déjà établir fermement 
que x => Vx est continue sur [0,+00[ : en effet, c’est la réci- 
proque de la fonction x + x", qui est continue puisqu'elle 
est polynomiale. 


FONCTIONS DE PLUSIEURS VARIABLES 
ol 


Puisque la continuité s'exprime en termes de convergence 
de suites, et que nous savons ce que signie « converger » pour 
une suite de vecteurs (voir proposition 3.29), nous pouvons 
étendre sans problème la définition principale de ce chapitre : 


DÉFINITION 4.26 -Soient X C R”, et f: X > R” une fonc- 
tion. On dit que f est continue en x € X lorsque pour toute 
suite (un)n>0 d'éléments de X qui converge vers x (dans R”), la 
suite (f(u,)) converge vers f(x) (dans R”). 

On dit que f admet € pour limite en xg € R” lorsque pour 
toute suite (u„)n>0 qui converge vers xo, avec chaque u, € X, la 
suite (f(u,)) converge vers £ (ceci même si xọ € X). 


Notons qu’une telle fonction est de la forme 


(X1,X2,....Xp) H> (fi (Xise. Xn) -s Jmn(X1r es Xn)). 


Chaque fonction f; est définie sur X et prend ses valeurs 
dans R. On appelle ces fonctions les « composantes » de f. 

Le résultat suivant se démontre exactement comme les 
énoncés correspondants pour les fonctions d’une seule va- 
riable. 


PropPosirion 4.27 — Les sommes, produits et inverses de fonctions 
continues, lorsqu'elles sont définies, sont continues. La composition 
de deux fonctions continues est encore continue. 

Avec les notations ci-dessus, la fonction f est continue si et 
seulement si chaque composante f; est continue. 

De plus, f est continue en x € X si et seulement si elle admet la 
limite f(x) en ce point. 

Enfin, une fonction f est continue en x si et seulement si, pour 
tout £ > O, il existe ò > O tel que ||f(x)— f (xo)|| < € pour tous les x € 
X tels que ||x — xoll < ô. 


Attention, par contre la réciproque d’une fonction continue 
de plusieurs variables n’est pas toujours continue, contraire- 
ment au cas traité dans le théorème 4.24. 


ExEMPLE 4.28 - La projection p;, définie sur R” par 


Pi(X1,X2,... Xn) = x, 


est continue : on le vérifie directement à partir des défini- 
tions. 
Partant de là, on peut utiliser des sommes et produits, 
par exemple 
(X1,X2,X3) > 2x1 %3 — x3 


est continue sur R° d'après la proposition précédente. 
On peut aussi composer avec des fonctions usuelles : 


(x1,x2) > sin(x1 x2) 
est continue, ainsi que 


—X3 


2 
(X1,X2,X3) => e17% — arctan(x) — 1). 


ExEMPLE 4.29 - Voici un exemple plus sophistiqué. On va 
identifier l’ensemble des matrices M,(R) avec R” pour 
toutes les questions de continuité (le fait de disposer les 
nombres en tableau ne change rien à l'affaire). De même 
on va identifier M„(R) x M„(R) avec R?” 

Ceci étant fait, il est légitime de demander si la fonction 
suivante est continue : 


f: M,(R)xM,(R) — M,R) 
(A,B) + f(A,B)=AB. 


Et la réponse est oui : si A = (a;;);,; et B = (b;;);,;, alors sur 
la ligne i, dans la colonne j de f (A, B) on trouve 


n 


Y ax bk j. 


k=0 


Cette expression est continue (elle est obtenue à partir 
des projections en faisant des produits et des sommes). 
Puisque les composantes de f sont continues, c'est que f 
est elle-même continue. 

Notons maintenant GL„(R) l'ensemble des matrices in- 
versibles de M„(R) ; c'est une notation standard qui fait ré- 
férence à l'expression « groupe linéaire ». Que dire de la 
continuité de la fonction suivante ? 


g: GL„(R) => GL,(R) 
A > Al, 


C'est loin d'être une question abstraite ou inutile. Lorsque 
vous confiez à un ordinateur la tâche de calculer l'inverse 
d'une matrice A à coefficients réels, dans de nombreux cas 
vous allez entrer une approximation B de la matrice A 
(disons en ne donnant qu'une dizaine de chiffres après la 
virgule). L'ordinateur vous donne la valeur de B-!. Est-ce 
que, du fait que B était proche de A, on peut s'attendre 
à ce que B`! soit proche de A7! ? C’est ce qu’on demande 
lorsque la continuité de g est étudiée. 

Dans le cas n = 2, nous pouvons répondre : en effet 
d’après la proposition 12.9, la fonction g s'écrit dans ce cas 


a b 1 d -b 
b d = ad = be —C À! 
(La même proposition affirme que sur GL,(R), la quan- 
tité ad - bc ne s'annule pas.) Cette expression est visible- 
ment continue. 
Nous allons voir que g est continue pour tout n, mais 


pour cela il va nous falloir développer la théorie des déter- 
minants, dans le chapitre du même nom. 


voir l'exercice 
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Chapitre 5 


Bolzano-Weierstrass 


LE THÉORÈME DE BOLZANO ET WEIERSTRASS 
[rr === "EEE me 


DÉFINITION 5.1 — Soit (u„)„>o une suite. Une sous-suite de (un) 
est une suite de la forme (uo(n))n>0 Où 6: N => N est une fonc- 
tion strictement croissante. 


Les exemples typiques sont (42,):>0 et (U2n41)n>0- 


THÉORÈME 5.2 (BOLZANO & WEIERSTRASS) - Soit (u,),>0 une suite 
de nombre réels. On suppose qu'il existe deux nombres a et b tels 
que u, € [a,b] pour chaque indice n. Alors il existe une sous- 
suite (Us(n))n>o qui possède une limite € € [a,b]. 


Souvent on énonce : « de toute suite de réels bornée on peut 
extraire une sous-suite convergente ». 

Démonstration. Posons ag = a, bo = b, et m = motto, le milieu 
de [40,bo]. Soit A C N l’ensemble des entiers n tels que u, € 
[ao, m], et soit B l’ensemble des entiers n tels que u, € [m, bo]. 

Les ensembles A et B ne peuvent pas être tous les deux finis, 
puisque A U B = N. Si A est infini, on pose aj = ag et bq = m; 
dans le cas contraire on pose a; = m et b, = bọ. 

Par récurrence, on construit 4,,, et b,,1 à partir de a, et b, 
de la même manière, en s’arrangeant pour qu'il y ait une infi- 
nité de termes de la suite dans l'intervalle [an+1; bn41]. 

On finit avec deux suites (a„) et (b,) telles que [b,-a,| = [b-a 
(puisque l’on divise la longueur de l'intervalle par 2 à chaque 
étape), et en particulier b, — a, > 0. De plus (a„) est crois- 
sante et majorée, donc converge vers l4, alors que (b„) est dé- 
croissante et minorée et donc converge vers l). On en conclut 
que 44 = U. 

Pour chaque entier n, choisissons maintenant un entier o(n) 
tel que 4, < Uo(n) < bn en s’arrangeant pour que o soit croissante 
(c'est possible par construction). Il est clair que uo(n) > & = 
la. 


Les applications sont plus théoriques que pratiques, au 
moins dans un premier temps. Elles sont par contre fondamen- 
tales, et vont prendre de plus en plus d'importance au fur et à 
mesure de vos études en mathématiques. 


FONCTIONS CONTINUES ET INTERVALLES COMPACTS 
l 


Nous avons vu avec le théorème des valeurs intermédiaires 
(4.8) que l’image d’un intervalle par une fonction continue est 
encore un intervalle. Il y a plusieurs types d’intervalles : ou- 
verts, fermés, semi-ouverts... Est-ce que l’image d’un intervalle 
est du même type que celui-ci? La réponse est non, comme sur 
la figure ci-dessous. 


Ici on voit une portion du graphe d’une fonction continue 
définie sur l'intervalle fermé [0,+co[, et son image est visible- 
ment l'intervalle ouvert ]=00,+00[ (il reste à imaginer la suite 
du graphe, évidemment). Méfiance donc. 

Par contre on a le résultat suivant, qui est notre première 
application de Bolzano & Weierstrass. 


ProposiTION 5.3 — Soit f une fonction continue définie sur l'inter- 
valle compact Ï = [a,b]. Alors f (I) est aussi un intervalle compact. 


Démonstration. Soit J = f(I), on sait que c’est un intervalle 
d’après le théorème des valeurs intermédiaires. Soit m = inf(J) 
ou m = -œ si l’inf n'existe pas; de même soit M = sup(J) 
ou M = +œ si le sup n'existe pas. On a donc J = (m,M) où les 
parenthèses signifient qu'on ne sait pas encore s’il s’agit de | 
ou |]. 

Prenons une suite (y,) telle que y, > M, avec y, € J. Par dé- 
finition on a y, = f (xn) pour un certain x, € I = [a, b]. D'après le 
théorème de Bolzano et Weierstrass, on peut «extraire » une 
sous-suite (Xo(n)) qui converge vers € € [a,b]. Par continuité 
de f, on a f (Xs(n)) = Vo(n) > f (€). Comme (Yo(n)) est une sous- 
suite de (y,), elle doit converger vers M, et donc M = f (£). 

On en conclut que M + +œ, et que M € J. On procède de 
même pour montrer que m + -œ et que m e J. Finalement J = 
[m, M]. 


Notons bien, en particulier, que l’on a le résultat suivant : 


CoROLLAIRE 5.4 — Soit f une fonction continue définie sur un in- 
tervalle compact. Alors f atteint son maximum et son minimum. 


L'expression « f atteint son maximum et son minimum » 
contient plusieurs choses, qui sont toutes des conséquences du 
fait que l’image de f est de la forme [m, M], mais qu'il est bon 
dénoncer séparément. Tout d’abord le sup des valeurs prises 
par la fonction, que l’on note M, n’est pas +00; mais plus pré- 
cisément, on sait aussi qu'il existe un x dans l’ensemble de dé- 
finition tel que f(x) = M. C'est pour cette raison que l’on parle 
du maximum de f et pas seulement de son sup, pour insister. 
De même avec le minimum m. 

Il peut y avoir plusieurs valeurs pour lesquelles les extrema 
sont atteints, bien sür. Sur la figure ci-dessous, le maximum 
de la fonction est atteint en x, et x>, et le minimum est atteint 
en x3. 


On comparera la situation avec celle de la fonction x + 1, 


définie sur l'intervalle ]0,+co[ (qui n'est pas compact) : elle ne 
possède ni maximum ni minimum. L'inf des valeurs de cette 
fonction est 0, mais cette valeur n'est pas atteinte. 

Le corollaire prédit donc l'existence de valeurs maximales 
et minimales sous des hypothèses assez simples. Il est bien 
utile, comme on va le voir. 


- Fin de la première lecture - 


PARTIES COMPACTES 
om 


Les arguments utilisant le théorème de Bolzano et Weier- 
strass sont tellement efficaces que l’on en vient à donner un 
nom aux ensembles sur lesquels on peut l'adapter. 


DériniTIoN 5.5 — Soit X C R”. On dit que X est compact lorsque 
de toute suite (u,),>0 avec u, € X on peut extraire une sous- 
suite (uo(n))n>0 qui converge vers € € X. 


Avec ce vocabulaire, le théorème de Bolzano et Weiers- 
trass peut être interprété comme affirmant que les ensembles 
que nous avions d'ores et déjà appelés « intervalles compacts » 
sont effectivement compacts au sens de cette définition. Ce 
sont d’ailleurs les seuls intervalles ayant cette propriété. Par 
exemple [0,+co[ n’est pas compact, puisque la suite (2"),>9 n'a 
pas de sous-suite convergente; de même ]0,1[ n’est pas com- 
pact, puisque la suite (H) sa ne possède que des sous-suites qui 
convergent vers 0, et 0 ¢]0,1[ (noter la condition £ € X, très im- 
portante, dans la définition). 

L'étude des compacts se fera plus en détails en deuxième 
voire troisième année. Nous allons cependant voir un exemple 
riche de conséquences. 


PropositIoN 5.6 — Soit R C R? un rectangle de la forme 
R = [a, b] x [c, d]. 
Alors R est compact. 


Démonstration. Soit (u,),>0 une suite d'éléments de R, et no- 
tons Un = (Xm Yn). 

D’après le théorème de Bolzano et Weierstrass, on peut 
trouver une sous-suite (Xo(n)) qui converge vers £ € [a, b]. Appli- 
quons le même théorème à la suite (z,) définie par z, = Yo(n) : il 
existe une sous-suite (z:()) qui converge vers €” € [c,d]. Notons 
que ZrT(n) = Vo(t(n)): 

Considérons la suite (x{x(1))) : c'est une sous-suite de (xo(n)) 
donc elle converge vers £. Donc finalement u,{11)) converge 


vers (l, l’). 


Citons un exemple de résultat dont la démonstration se dé- 
duit immédiatement de celle que nous avons donnée pour les 
intervalles compacts. 


ProposiTION 5.7 — Soit f : X > R une fonction continue, où X C 
R" est un compact. Alors f atteint son maximum et son minimum. 


À titre d'exercice vous montrerez ceci en adaptant l'argu- 
ment donné pour le corollaire 5.4 : vous verrez qu'il n'y a es- 
sentiellement rien à changer. 


voir l'exercice 
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AUTRES ÉTUDES DE MINIMA ET MAXIMA 
EE TA P EAR 


Pour montrer l'existence d'un maximum ou d'un minimum 
d'une fonction f dont on ne sait pas grand'chose, ou avec la- 
quelle on ne souhaite pas faire de calculs compliqués (comme 
les dérivées du chapitre suivant), on essaie souvent de se ra- 
mener au corollaire 5.4. Lorsque la fonction en question n'est 
pas définie sur un compact, il faut faire des efforts supplémen- 
taires. Voici un exemple simple. 


ProposiTION 5.8 — Soit f : R? > R une fonction continue. 


1. Supposons que pour toute suite (u,),>0 telle que |[u„]] => +0, 
on a f(u„) => +00. Alors f atteint son minimum sur R?. 


2. Supposons que pour toute suite (u,),>0 telle que |\u„|| — +00, 
on a f(u,) > 0. Alors f atteint son maximum sur R?. 


Démonstration. Montrons le (1), le (2) étant similaire. Soit 
R, = [-n,n] x [-n, n]. 


Ce rectangle est compact d’après la proposition 5.6, donc 
sur R, la fonction f atteint un minimum en u„ (proposition 
5.7). 

Puisque R„ C Rp41, ON a f (Un41) < f (un) (le minimum dimi- 
nue quand on le prend sur une partie plus grande). Montrons 
maintenant qu'il existe un entier N tel que tous les termes u, 
appartiennent à Ry. Par l'absurde, si ce n'était pas le cas, on 
aurait une sous-suite (Us(n))n>0 telle que [[ug(. l] > +00 : il suf- 
fit de prendre u,(,) à l'extérieur du rectange R„. Par hypo- 
thèse f(us(n)) > +0, ce qui est absurde puisque (f (us(n))) est 
décroissante. Donc N existe. 

Si maintenant x € R?, on a x € R„ pour un certain n, et 
donc f(x) > f(u„); mais u„ € Ry, donc f(u„) > f(un). Fina- 
lement f (uyn) est le minimum de f. 


CONTINUITÉ UNIFORME 
| 


La prochaine application du théorème de Bolzano et Weier- 
strass concerne une propriété fine des fonctions continues. 
Rappelons que dans le (3) du théorème 4.20, nous avons mon- 
tré qu’une fonction f était continue au point x, si et seulement 
si la condition suivante était satisfaite : pour tout € > 0 on doit 
pouvoir trouver un à > 0 de telle sorte que |f (x) - f(xo)| < € dès 
que |x — xol < 8. Voyons ça sur un exemple. 


ExEMPLE 5.9 — Prenons f(x) = 1 sur l'intervalle ]0,1], et 
soit xg dans cet intervalle. Montrons que f est continue 
en xÓ directement à partir de la définition (c'est-à-dire sans 
utiliser le fait qu'il s'agit de l'inverse d'une fonction conti- 


nue qui ne s'annule pas). Soit donc € > 0. Calculons : 


XX0 


On a donc |f (x) - f (xọ)| < e dès que |x = x| < xxo. Mais on 
ne peut certainement pas prendre ò = EexXo, puisque ò ne 
doit pas dépendre de x, par définition. 

Par contre, choisissons un nombre p > 0 tel que p < xg, 
et prenons à = ep?. Pour tous les x dans l'intervalle [p,1]on 
a ©’ < exxo, donc l'inégalité |x— xo| < 6’ entraîne bien |f (x) - 
f (xo)l < ë. 

Pour finir, nous devons prendre ò tel que 0 < ô < & 
d'une part, et ò < xo - p d'autre part. Avec ce ò, l'inéga- 
lité |x = xol < ô entraîne x = xọ — (xg — x) > xg — ô > p, c'est-à- 
dire que x € [p, 1]; l'argument ci-dessus donne donc |f (x) - 
f (xo)| < ë dès que |x = xol < ò. 


Une chose à retenir de ce calcul, c'est que sur un intervalle 
de la forme [p,1] on peut prendre le même à’ pour tous les 
points xp à la fois (à savoir à’ = ep?). Alors que sur ]0,1], nous 
venons de le voir, il faut choisir un ò qui dépend de xs. 

Ce phénomène porte un nom : 


DérinirioN 5.10 - Soit I C R, et soit f : I > R. On dit que f est 
uniformément continue sur I lorsque pour tout € > 0, il existe ò > 
0 tel que |f (x)-f (xo)| < ë dès que l’on choisit x, xg € I tels que |x— 
Xol < ò. 

Avec ce langage, nous pouvons dire que la fonction x + 1 
est uniformément continue sur chaque intervalle compact de la 
forme [0,1] pour 0 < p < 1. Par contre, sur l'intervalle ]0,1], la 
fonction définie par la même formule n’est pas uniformément 
continue. C’est l'essence de l'exemple 5.9. 

On peut se demander pourquoi rentrer dans des considé- 
rations si précises. La réponse arrivera avec le chapitre sur les 
intégrales : il se trouve que, pour définir rigoureusement l’in- 
tégrale d’une fonction, nous aurons besoin de savoir que la- 
dite fonction est uniformément continue. Heureusement, nous 
n’aurons pas à refaire un travail comme ci-dessus pour chaque 
fonction, puisque le théorème suivant nous épargne toutes les 
difficultés. 


THÉORÈME 5.11 (HEINE) — Soit f une fonction continue sur un 
intervalle compact. Alors elle est uniformément continue. 


Démonstration. Procédons par l'absurde. Si f n’est pas unifor- 
mément continue, alors il existe un € > 0 tel que pour chaque 
ò > 0, on peut choisir x et y tels que |x - y| < ò et cepen- 
dant |f (x) - f(y)| > £. Prenons à, = 1 pour chaque entier n > 1, 
et notons x, et y, nos choix pour ôq. 

Soit I = [a,b] l'intervalle sur lequel f est définie. D’après 
la proposition 5.6, le rectangle R = I x I est compact. La suite 
définie par u, = (x,,7,) possède donc une sous-suite (y) = 
(Xo(ny Yo(m) qui converge vers (£, l’) € R. En d’autres termes on 
a X5(n) > € et Dita > €, et donc Xofn) Dogg > € - €”. De plus, 
puisque 

n= o0 


1 
|Xo(n) = Vo(nm)| < õo(n) = oln) — 0, 


on constate que £ = l’. 
Enfin, par continuité de f, on a f (x5(m)) > f (€) et f(Yo(n)) > 


f (€), donc 
S (Xon) -= f (Yo(n)) - 0. 
Mais dans la mesure oà 
|f (tata) = f (Votm)] >e>0, 


cette dernière convergence vers 0 est impossible. Cette conclu- 
sion absurde montre que f est uniformément continue. 


Chapitre 6 


Deriveées 


DÉFINITIONS & PREMIÈRES PROPRIÉTÉS 
[=== > 


DÉFINITION 6.1 - Soit f une fonction définie sur un intervalle I. 
On dit que f est dérivable au point xọ € I lorsque le taux d'ac- 
croissement, c'est-à-dire la fonction définie par 


f (x) = f (xo) 


Ta (x) = X—X0 


(pour x + xg) possède une limite (finie). Lorsque c’est le cas, 
cette limite est notée f’(xo), et ce nombre est appelé le nombre 
dérivé en xp. 

La fonction x + f'(x), lorsqu'elle est définie en tout point 
de I, est appelée la dérivée de f. 


Le taux d’accroissement T, (x) ci-dessus est la « pente » de 
la droite qui passe par (xo, f (xọ)) et par (x, f(x)). En faisant va- 
rier x, avec xp fixé, on obtient toute une famille de droites. 
Lorsque f est dérivable en x, ces droites atteignent une po- 
sition « limite » lorsque x se rapproche de xg. La droite passant 
par (xo, f (xo)) et dont la pente est cette valeur limite f’(xo) est 
appelée la tangente au graphe de f au point x9. La situation est 
illustrée sur le dessin suivant. 


f(x) - 


f (xo) - 


Lorsque f’(xo) > 0, la droite tangente est le graphe d'une 
fonction croissante ; il est raisonnable de penser alors à f elle- 
même comme à une fonction croissante au voisinage de xo, 
et dans ce chapitre nous allons rendre cette intuition précise. 
Puisque vous connaissez le résultat (sans démonstration !) de- 
puis le lycée, inutile de vous faire patienter : nous verrons que 
lorsque f'(x ) > O pour tous les x Ô, alors la fonction est crois- 
sante. 

Le plus étonnant avec les dérivées reste la facilité avec la- 
quelle on peut les calculer. 


ExEMPLE 6.2 — Prenons f(x) = x, sur R tout entier par 
exemple. Pour tout xo, on a 


__X—X0 _ 


Txo (x) 1. 


z X— Xo 
Cette fonction a donc certainement une limite, qui vaut 1. 
C'est-à-dire que f’(xọ) = 1, pour tout xg € R. 

Autre exemple simple, si g(x) = c est une fonction 
constante, alors le taux d’accroissement est 


C—C 


et donc g’(x0) = 0. 
Un peu plus compliqué, prenons h(x) = 1 sur R*. Alors 
le taux d’accroissement est 


h(x) — h(xo) 1 É 1 | 1 


X- Xo ` x=Xq x Xo 


Cette expression tend vers -5 lorsque x > xọ, donc h est 


0 
dérivable et h’(xo) = = >. 
0 


Avant même de donner d'autres exemples, notons la chose 
suivante : 


Lemme 6.3 — Soit f une fonction dérivable en xÔ. Alors f est éga- 
lement continue en xp. 


Démonstration. On écrit simplement 


f(x) - f (xo) 
x 


- Xo 


f(x) - f (xo) = (x - xo): > 0 x f'(xo) =0, 


donc f admet pour limite f (xg) lorsque x > xO, ce qui signifie 
bien qu'elle est continue. 


ExeMPLE 6.4 - Donnons quelques exemples de fonctions 
qui ne sont pas dérivables. Le plus simple est de prendre 
une fonction qui n'est pas continue : d'après le lemme, elle 
ne peut pas être dérivable non plus. 

Mais il existe des fonctions continues qui ne sont pas 
dérivables. Prenons par exemple la « valeur absolue », 
c'est-à-dire la fonction x + |x|, définie sur R. Prenons xg = 
0 et examinons le taux d'accroissement : 


He 1six>0, 


To(x) x—0 —1 six <0. 


Cette expression n'a pas de limite en 0, puisque par 
exemple on a To(À) —— 1 alors que To(-À) — -1. 
n— 00 


n— 00 


Donc la fonction valeur absolue n’est pas dérivable en 0. 
(Et en xg, pour xo + 0?) 

Autre exemple, la fonction définie sur [0,+co[ par x + 
Vx. En x9 = 0, le taux d’accroissement est 


_ Vx-vV0 1 
= x-0 yx 
défini sur ]0,+cœ/[. On a donc To(x) — +0 lorsque x > 0, et 


il n'y a pas de limite finie : la fonction n'est pas dérivable 
en 0 (et ailleurs ?). 


To(x) 


PROPOSITION 6.5 — Soient f et g deux fonctions définies sur I et 
dérivables en xo € I. Alors 
o (somme) x => f(x) + g(x) est dérivable en xo, et sa dérivée en 
ce point est f'(x9) + g’(xo). 
© (produit) x + f(x)g(x) est dérivable en x, et sa dérivée en 
ce point est f’(xo)g(xo) + f(Xo)g/(xo). 


Démonstration. Montrons la formule pour le produit (celle 
pour la somme est facile et laissée en exercice). On étudie le 
taux d’accroissement : 


foga) - f (xo)g(xo) _ EOR] 


xX — Xo — Xo 


Puisque f est continue en x, en vertu du lemme précédent, 
cette expression a bien pour limite f(xo)g’(xo) + f’(xo)g(xo), 
comme annoncé. 


ExEMPLE 6.6 — Prenons f(x) = g(x) = x. Alors la proposition 
indique que la dérivée de x > x? est x> 1xx+x x 1 = 2x. 
Continuons : la dérivée de x H> x? = x? x x est, toujours 
d’après la formule sur le produit, donnée par x => (2x)x x+ 
x? x 1 = 3x. 

En continuant de cette manière, on montre par récur- 
rence (faites-le) que la dérivée de x + x" est x + nx"-l. 

Si on se donne une constante c, et que l’on applique 
encore et toujours la formule pour le produit, on constate 
que la dérivée de x => cx" est x => Oxx"+cxnx"-! = enx", 

Enfin, grâce à la formule pour la somme, on constate 
que toute fonction polynomiale, c’est-à-dire de la forme 


xH a FAL X+@Xx ++ ay x" 
est dérivable, de dérivée 


x> aj + 2az x+ 3a3 x? +--+ na, x"! 


Voici une autre définition de la dérivabilité, qui va paraître 
artificielle pour l'instant mais dont on comprendra le caractère 
naturel dans le chapitre sur les formules de Taylor. 


Lemme 6.7 - f est dérivable en xo si et seulement s'il existe deux 
nombres ao et a; tels qu'on peut écrire 


f(xo+h)= ao +a h+ he(h), 


où e(h) > O quand h > O. De plus, lorsque ces nombres existent, 
on a ag = f (xo) et aj = f (xo). 


Lisez soigneusement la démonstration ci-dessous, qui est 
particulièrement simple, afin de comprendre qu’il s’agit juste 
d’une reformulation des choses. Géométriquement, le lemme 
affirme que la fonction h => f (xo) + f’(xo)h, dont le graphe est 
une droite (la droite tangente), est une « bonne » approxima- 
tion de la fonction h + f(x + h), puisque la différence entre 
les deux, qui vaut he(h), est le produit de deux fonctions qui 
tendent vers 0. 


Démonstration. Supposons d’abord que f est dérivable en xs, 
et posons (nous n'avons guère le choix) 


f (xo +h) - f (xo) - f'(xo)h _ f(xo + h) - f (x0) 


e(h) = h 7 f (xo), 


pour h + 0, et e(0) = 0. Par définition, on a bien e(h) > 0 
lorsque h > 0, et on a tout fait pour que f(xo + h) = f (xo) + 
f'(xo)h + he(h). 

Montrons la réciproque ; supposons que 49 et 4, existent, 
tels que f(xo + h) = ao + ai h + he(h) avec e(h) > 0. Tout d’abord 
en faisant tendre h vers 0, on constate que 

li = li h) = ao. 
Jim f(x) lim f (xo +h) = ao 
Mais alors, la proposition 4.16 nous dit que ag = f (xp). 
Par suite le taux d’accroissement en x, vaut 
f(x) — f(xo) _ f(xo+h) - f(xo) 


X=Xq = h =a, +e(h), 


en posant h = x — xp. Lorsque x > x9, ce taux d’accroissement 
tend donc vers a,, ce qui par définition signifie que f est déri- 
vable en x, et que f’(xo) = 41. 


Avec cette nouvelle formulation, il devient facile de mon- 
trer un résultat sur la composition des fonctions : 


ProposiTION 6.8 — Soit g: I — J une fonction dérivable en xq € I, 
et soit f : J — R une fonction dérivable en g(xo) € J. Alors f og est 
dérivable en xp, et de plus 


(f o 8) (xo) = F'(g(xo))g (xo)- 
Démonstration. D'après le lemme, on peut écrire 
g(xo + h) = g(xo) + g'(xo) h + he(h), 
avec e(h) > 0 lorsque h > 0, et de même en posant yo = g(xo), 


f(yo +u) = f(yo)+ f'(yo)u +ub(u), 


avec fp(u) > 0 lorsque u > 0. On commence donc par écrire 


fog(xo+h) f [g(xo +h)] 
= f[g(xo) + g'(xo) h + he(h)] 
f(vo +u), 


en posant u = g'(x 9) h + he(h). On peut donc poursuivre : 


fog(xo+h) F (vo) + F’(vo)u + ub(u) 
= f(yo) +f (vo) [g(xo)h + he(h)]+ up(u) 
f (vo) + f (vo)g'(xo)h + hO(h), 


où l'on a rassemblé tous les termes manquants dans 0(h), c’est- 
à-dire que l'on a posé 


O(h) = f '(yo)e(h) + (g'(xo) + e(h))@$ [Hg (xo) + e(h))] . 


Cette expression est peut-être compliquée, mais l'on retiendra 
simplement que O(h) > 0 lorsque h > 0. 

On donc trouvé ag = f (yo) et 41 = f'(vo)g/(xo) comme dans 
le lemme, et on conclut que f o g est dérivable en x, comme 
annoncé. 


ExEMPLE 6.9 - Prenons f(t) = 2 sur J = R*. Nous avons vu 
dans l'exemple 6.2 que f’(t) = -77 

Si on se donne maintenant une fonction g définie sur I 
telle que g(x) +» 0 pour tout x € I, alors on peut la voir 
comme une fonction I — J. On peut donc considérer f o g, 
et on a tout simplement f o g (x) = = 


g(x)" 
e 


La proposition affirme que cette fonction est dérivable, 


et que sa dérivée en x est 


1 g'(x) 
= 


f'(g0)) gŒ) => g(s) => 


Ce résultat est à savoir, donc nous allons l'énoncer séparé- 
ment. 


ProposirioN 6.10 - Soit g: I > R une fonction dérivable qui ne 


s'annule pas. Alors la fonction x + = est dérivable, de déri- 
g (x) 


vée x H> — r 
g(x)? 


PropPosirion 6.11 — Les fonctions suivantes sont dérivables sur le 
domaine indiqué : 

o x +> e* sur R, et sa dérivée est x => e^, 

o x H> sin(x) sur R, et sa dérivée est x H> cos(x), 

o x H> cos(x) sur R, et sa dérivée est x > -sin(x), 

o x H> tan(x) sur Rx (5 +km avec k € Z}, et sa dérivée est x > 


1 + (tan(x))?, ; 


© x> ln(x) sur ]0,+col, et sa dérivée est x > <, 

ô 2,92 1 
© x arcsin(x) sur ]—1,1[, et sa dérivée est x > Te 
o x arccos(x) sur ]—1,1[, et sa dérivée est x => =f 


© x H> arctan(x) sur R, et sa dérivée est x H> T» 


il Do 
o x > Vx = x” sur ]0,+00[ pour n > 1, et sa dérivée est x => 
LEA  1,V,-1 
NT = a 


Ce n’est pas la première fois que nous sommes dans cette 
situation : nous n'avons pas de (vraie) définition des fonctions 
exponentielle, sinus et cosinus, donc aucun espoir de faire cette 
démonstration pour l'instant. Dans l’appendice intitulé « L'ex- 
ponentielle », nous pourrons remédier à cela. 

On peut par contre calculer la dérivée de la fonction tan- 
gente à l’aide des formules pour cosinus et sinus : faites-le. 
Dans la deuxième partie de ce chapitre, nous verrons un ré- 
sultat sur la dérivée de la réciproque d’une fonction, à partir 
duquel nous pourrons démontrer les formules ci-dessus pour 
les cinq derniers exemples. 


LE THÉORÈME DES ACCROISSEMENTS FINIS 
ee —_—_—_——]—]—— 


Le théorème des accroissements finis est aux fonctions dé- 
rivables ce que le théorème des valeurs intermédiaires est aux 
fonctions continues : c’est ce résultat qui justifie les définitions. 

Commençons par une remarque simple et importante : 


Lemme 6.12 — Soit f : [a,b] > R une fonction. On suppose qu'il 
existe c €]a, b| tel que f est dérivable en c, et tel que f atteint un 
extremum (maximum ou minimum) en c. Alors f'(c) = 0. 


Démonstration. Supposons que f atteint un minimum en c, 
donc que f(x) - f (c) > 0 pour tout x € [a, b]. Alors 


f(x) - f (c) 


> 0 pour x>c. 
x-c 


En passant à la limite, on obtient f'(c) > 0. Mais 


f(x) - f(c) 


< 0 pour x <c, 
x-cC 


et en passant à la limite on obtient f'(c) < 0. 
Finalement f'(c) = 0, comme annoncé. On procède de ma- 
nière similaire dans le cas d'un maximum. 


Attention à ne pas faire dire à ce lemme plus que ce qu'il 
ne dit vraiment. Tout d'abord il ne faut pas oublier la condi- 
tion c €]a, b[ : penser à la fonction f(x) = x sur [0,1], elle atteint 
un minimum en 0 et un maximum en 1, mais sa dérivée ne s'an- 
nule pas. Ensuite, noter que la réciproque du lemme est fausse : 
par exemple la fonction f(x) = x° sur R vérifie f'(0) = 0, mais 
on ne peut trouver aucun intervalle [a, b] comme dans l'énoncé. 


THÉORÈME 6.13 (ACCROISSEMENTS FINIS) — Soit f : [a,b] _> R une 
fonction continue. On suppose que f est dérivable sur ]a, b[. 
Alors il existe un nombre c avec a < c < b tel que 


fo- fa 
=a 


f'(c) = 


Bien sür le nombre c n'est pas unique en général. 


Démonstration. Posons 


A= 


, 


f (b) - f(a) 


a 


et g(x) = f(x) - Ax, pour x € [a,b]. La fonction g est dérivable 
et g'(x) = f(x) — A. Nous allons montrer le théorème pour la 
fonction g; puisque g(b) - g(a) = f (b) - f (a) - A(b - a) = 0, on a 


et il s'agit de montrer qu'il existe c tel que g'(c) = 0. Mais 
alors g’(c) = f'(c) -A = 0 et on a bien f'(c) = A, donc le théo- 
rème est montré pour f également. 

(La fonction g vérifie g(b) = g(a), et dans ce cas particulier 
le théorème s'appelle « théorème de Rolle ».) 

D'après la proposition 5.3, on a g([a, b]) = [m, M], puisque g 
est continue. Si g est constante, alors g'(x) = 0 pour tout x, et 
il n'y a rien à montrer ; on peut donc supposer que m < M. 
Soit x, € [a,b] tel que g(x1) = m et soit x tel que g(x2) = M. 

Si xı €la, b[, on prend c = xı. Puisque g atteint alors un mi- 
nimum en c, on a g'(c) = 0 d’après le lemme. 

Si au contraire x, = a ou b, on a g(a) = g(b) = m. Mais 
alors x, €Ja,b[ puisque m + M. Dans ce cas on pose c = x), et 
puisque g atteint un maximum en c, le même lemme donne 
encore g’(c) = 0. 


La plus importante conséquence est bien sûr : 


CoroLLAIRE 6.14 - Soit f une fonction dérivable définie sur l'in- 
tervalle I. Alors 
© si f'(x) > O pour tous les x € I, alors la fonction f est crois- 
sante ; 
© si f'(x) > O pour tous les x € I, alors f est strictement crois- 
sante ; 
© si f'(x) < 0, resp. f'(x) < O, alors f est décroissante, resp. 
strictement décroissante ; 
© si f'(x) = 0 pour tous les x € I, alors f est constante. 


Démonstration. Montrons le premier point, les autres étant si- 
milaires (le dernier est même une conséquence des autres). 
Supposons donc que f’(x) > 0 pour x € I. Si a < b sont deux 
éléments de I, alors d’après le théorème il existe c tel que 


b-a 


On en déduit que f (b) > f(a). 


Vous connaissez le principe depuis la terminale, mais un 
petit rappel ne peut pas faire de mal : l'intérêt des dérivées 
réside dans le fait que les calculs sont assez faciles, et en tout 
cas se ramènent à un ensemble de règles « formelles » que l'on 
peut même apprendre à un ordinateur. Et pourtant, grâce à 
ce dernier corollaire, les informations que l'on obtient sur les 
fonctions sont utiles et précises. 

Au lycée vous avez normalement passé beaucoup de temps 
à étudier des fonctions à l'aide de ce résultat, ce qui néces- 
site un certain entrainement. Nous allons à présent donner un 
exemple archi-simple pour rappeler un peu la méthode ; dans 
les exercices vous êtes invités à vous refaire la main. Dans le 
chapitre suivant nous verrons quelques exemples supplémen- 
taires. 


ExEMPLE 6.15 - Regardons la fonction f définie sur R par 
f(x) = ax?+bx+c, 


où a,b,c € R, avec a + 0. Soit ô E C un nombre tel que ô? = 
b? — 4ac ; nous savons que les racines de f, qui peuvent être 
réelles ou complexes, sont 


—b—6 __—b+ù 


et X2 = ; 
2a Z 2a 


X1 = 


Regardons la dérivée : f(x) = 2ax+b. Supposons que a > 0. 
On a donc f'(x) > 0 pour x > -Z, et f'(x) < 0 pour x < 
À, ainsi que f’(x) = 0 pour x = = La fonction est donc 
décroissante sur ]- œ,-Z] et croissante sur [-Z,+00[; on 
en déduit qu'elle atteint un minimum en -2, ce qui est 
cohérent avec le fait que la dérivée s'annule en ce point. 

Noter que ce nombre -2 est la moyenne des deux ra- 
cines L(x1 + x2). De plus, la valeur minimale prise par f 
est 


et cette valeur est négative si et seulement si b?—4ac > 0. À 
l'aide du théorème des valeurs intermédiaires, on retrouve 
le fait que les racines sont réelles si et seulement si le dis- 
criminant b? — 4ac est positif. 


b? : 
Ja +C $ 


- Fin de la première lecture — 


voir les exercices 
698, 699, 700, 
701, 703,705; 
709, 1221, 
1223,.715,717, 
718,721 


LE THÉORÈME DU POINT FIXE 
—_—_———————— 


DÉFINITION 6.16 — Soit f : I > R une fonction et soit k > 0. On 
dit que f est k-lipschitzienne sur I lorsque 


HOUSSE 


pour tous x,y € I. 


Lorsque 0 < k < 1, on dit parfois d’une fonction lipschit- 
zienne qu'elle est « contractante », c’est-à-dire qu’elle réduit les 
distances. 

Vous montrerez à titre d'exercice très facile que si f est k- 
lipschitzienne, alors elle est continue, et même uniformément 
continue (définition 5.10). 

Il est important de garder en tête que lorsque f est déri- 
vable, alors cette notion nouvelle se ramène à un critère très 
simple : 


Lemme 6.17 — Soit f : Ï > R une fonction dérivable. Alors f est k- 
lipschitzienne si et seulement si |f '(x)| < k pour tout x E I. 


Pour l'intuition il est donc raisonnable, dès lors qu’on a af- 
faire à une fonction lipschitzienne, de penser à une fonction 
dérivable de dérivée bornée. 


Démonstration. Si f est k-lipschitzienne, on écrit 
Te 2 f E 0 
X- Xp 


=k, 


X- Xp 


d’où |f/(x )| < k en passant à la limite. 

Réciproquement si |f (x )] < k pour chaque xp, alors on uti- 
lise le théorème des accroissements finis pour écrire 

(x) - f(y) , 
E =|f'()l < k 


x 


pour tous x, y. Le résultat en découle. 


THÉORÈME 6.18 (THÉORÈME DU POINT FIXE) — Soit f : Ï — I une 
fonction k-lipschitzienne, pour O < k < 1. Alors f possède un 
unique « point fixe » dans I, c'est-à-dire qu'il existe un unique xo € I 
tel que f (xo) = xo. 

De plus, si ug € I est choisi arbitrairement, et si l'on définit une 
suite (Un)n>0 par Un41 = f (Un), alors (un) es Xo. 


Démonstration. Commençons par l'unicité. Si xg et xı sont 
deux points fixes de f, alors |f (x1)- f (xọ)| = |x1 — xol d’une part, 
mais par hypothèse on a aussi |f (x1) = f(xo)| < klx, — Xol. On a 
donc |x; — xo| = 0 puisque k < 1, d’où x; = xo. 

Prenons maintenant uo et définissons (u„) comme dans 
énoncé. Si on peut montrer que (u,) possède une limite £, 
alors la suite (f(u,)) doit converger vers f (£) par continuité 
de f ; mais f(u,) = Un+1, donc (f(u,)) est une sous-suite de (u,), 
et à ce titre elle converge vers €. Donc £ = f (£) et par unicité, 
l = Xo. 

Il faut donc montrer que (u„) converge. Écrivons 


Un = Ug + (U1 — Ug) + (U2 — U1) +: + (Un Un-4). 


En d’autres termes en posant 4, =u,-u,_j0na 


n 
Un = Ug + ) aj. 
ï= 


Nous allons montrer que la série de terme général a; converge 
absolument, et donc converge d'après le théorème 3.21. Pour 
cela, notons que 


|a] = |u; - 14;-1| = |f (14;-1) - f (ui-2)l 
< k|ui-1 = ui-2| = k|f (ui-2) - f(ui-3)l 
< k? ]u;_2 -u; 3] 


< k? |ui-3 — ujal 


IA 


< K [u = uol. 
Ceci montre que 


n 


_ 1k 
Y Jail < [us = uol(1 +k +k? +-+ + k") = fs — uol => 
i=1 
< hi il 
Uj — ugl zs 
>H ATEK 


On a donc bien 


+00 


Y lail <+œ, 


i=1 


c'est-à-dire que la série est absolument convergente. 


Il est très facile de représenter la situation sur un dessin. 
Prenons I = [0,1], et traçons le graphe d’une fonction déri- 
vable, telle que la pente de la tangente reste petite : d’après 
le lemme 6.17, elle est lipschitzienne. On fait en sorte que la 
fonction prenne ses valeurs dans [0,1], bien sûr. Ajoutons au 
dessin un point ug et son image f (uọ), ainsi que la diagonale 
(l'ensemble des points {(x, x) | x € [0,1]}). 


i 


fo). 


Pour dessiner les points suivants de la suite, on doit repor- 
ter f (ug) sur l'axe des abscisses. Pour cela, nous devons en fait 
prendre le symétrique du point (0, f (u )), qui se trouve déjà sur 
la figure sur l’axe des ordonnées, par rapport à la diagonale. 


o; I 
‘0 u = f (uo) uo 1 


Nous allons poursuivre en conservant uniquement les seg- 
ments indiqués en traits pleins. La recette est simple : on part 
d’un point du graphe, on rejoint la diagonale, puis on vire à 
angle droit en direction du graphe. On obtient une figure en 
forme de spirale, qui montre bien la convergence de la suite 
vers le point à l'intersection du graphe et de la diagonale, c’est- 
à-dire le point fixe. 


1 


À titre d'exercice, tentez l'expérience suivante : essayez de 
faire le même dessin mais avec un graphe tel que la dérivée au 
« point fixe » est -2 ou -3. Que se passe-t-il ? 


ExEMPLE 6.19 (CALCUL NUMÉRIQUE DE RACINES CARRÉES) - Il 
arrive parfois que l'intérêt du théorème ne soit pas dans 
l'existence et l'unicité du point fixe, qui peuvent être évi- 
dentes pour d’autres raisons, mais dans la méthode de 
calcul de ce point fixe qui est proposée, à l’aide de la 
suite (u,). 

Voici un exemple. Considérons la fonction f définie 
pour x > 0 par f(x) = (x+ À), où À est un réel posi- 
tif. L'équation f(xo) = xo est équivalente à x$ = À, qui 
pour xo > 0 possède la solution unique xg = VA. Oui, 
mais comment évaluer numériquement VA? Il existe plu- 
sieurs façons de procéder évidemment, mais le théorème 
du point fixe en fournit déjà une qui est efficace. 

Pour se ramener au cadre du théorème, prenons a = 
VX et b > VÀ quelconque, et posons I = [a,b]. La déri- 
vée est donnée par f'(x) = 4(1 - à), et on vérifie alors 
que 0 < f'(x) < $ pour x € I. On en déduit que f est $- 
lipschitzienne sur I. De plus, f est croissante sur cet inter- 
valle ; comme f (a) = a, et puisqu'on voit de suite que f (b) < 
b, l'intervalle I vérifie f (I) CI. 

À partir de maintenant, on voit f comme une fonc- 
tion I > I à laquelle le théorème s'applique. En pre- 
nant par exemple uo = b, nous savons maintenant que la 
suite définie par récurrence par u,41 = f (Un) = Lun + À) 
converge vers VA. 

Essayons pour À = 2. En prenant b = 2, on en déduit 
que la suite vérifiant ug = 2 et uys1 = (Un + À) converge 


vers V2. Les premiers termes sont 


3 7 
= => = => =1,41 eA 
Ug 2 u1 7 1,5, u? 12 666 
puis 
77 665857 
13 AE 1568... i= = 1,41421356... 


= 408 470832 


De plus, on peut calculer la précision du résultat, ce qui est 
un grand mérite de la méthode. En effet, on a 


[14] - xol = |f (Un) - f(xo)l <klu, — xol, 


et on en déduit (un peu comme dans la démonstration du 
théorème) que 


lun — xol < k"lug — xol. 


Dans notre exemple, on a pris k = L et donc on sait que 


1 1 
lug =V2] < 77 |2=V2| < =á 


Comme 214 > 10000, on en déduit que l'écart entre u14 
et V2 est inférieur à 0,0001, par exemple; puisque u14 
commence par 1,414, on en déduit que V2 commence éga- 
lement par 1,414. (Et sachant ceci, on en déduit a poste- 
riori que u3 commence déjà par les 3 bons chiffres après 
la virgule; mais il fallait bien le démontrer... En réalité 
on peut montrer que dans ce cas particulier, le calcul est 
une application de la « méthode de Newton » et que celle- 
ci converge très vite. Les 5 premiers chiffres de u3 sont en 
fait corrects !) 


DÉRIVÉES ET RÉCIPROQUES 
[MM] 


PropPosirion 6.20 — Soit f : I — J une bijection, et soit f 1: J — I 
sa réciproque. On suppose que f est continue, et qu'elle est déri- 
vable au point x Ô € I, avec f’(xo) + 0. Alors en notant yọ = f (xo), 
la fonction f~! est dérivable au point yo et 


1 
LOGE 
f (xo) 

Démonstration. Le taux d'accroissement pour f"! au point yo 
est la fonction T,, définie par 


_ f) =f (po) 
HO yon 


pour y + yọ. On a donc 


vof (x) a FE- Fo) = XX) ; 
f (x) =f(xo) J (x) =f (xo) 
et cette expression a un sens pour x + xÒ puisqu'alors f(x) + 
f (xo). Par dérivabilité de f, on en déduit que T, (f (x)) > Fl] 
lorsque x > xp. 
Comme la fonction f~! est continue par le théorème 4.24, 
on a f -1(y) > f 1(yo) = xo lorsque y > yg. Par composition, 


nn 
f (xo) 


lorsque y > vo, ce qui signifie bien que f~! est dérivable en yọ, 
et que le nombre dérivé est celui annoncé. 


Ty (7) = Ty, [fU (9)] > 


En combinant plusieurs résultats déjà obtenus, on en arrive 
au théorème suivant, qui est facile à mémoriser. 


Avant 1990, 


Notez que l'on dit d'une fonction f qu'elle est continument 
l'orthographe 


dérivable pour indiquer qu'elle est dérivable et que f' est conti- 


nue. On parle aussi parfois de « fonction de classe C! ». sims 


était 

Démonstration. Puisque la fonction f’ est continue et ne s’an-  «continiment ». 
nule pas, elle ne peut pas changer de signe en vertu du théo- 
rème des valeurs intermédiaires : ainsi, ou bien f’(x) > 0 pour 
tout x € I et f est strictement croissante, ou bien f'(x) < 0 et f 
est strictement décroissante. Dans tous les cas, f est stricte- 
ment monotone, et donc injective. En notant J = f (I), qui est 
un intervalle encore d’après le théorème des valeurs intermé- 
diaires, on a donc établi que f : I > J est une bijection. 

La proposition précédente montre que f"! est dérivable en 
tout point de J, et montre également la formule pour (f-!}. 
Le lemme 6.3 montre que f"! est continue (le théorème 4.24 
aussi), et on en conclut que (f-!) = FFT est elle-même conti- 
nue. 

Enfin, une fonction strictement monotone ne peut pas avoir 
de minimum ni de maximum sur un intervalle ouvert (vérifiez- 
le), donc J doit être ouvert si I est ouvert. 


ExEMPLE 6.22 - On peut retrouver certains des résultats de 
la proposition 6.11. Par exemple, sachant que la fonction 
exponentielle est dérivable, et que c’est même sa propre 
dérivée, on peut calculer la dérivée de sa réciproque, le lo- 
garithme, à partir du théorème : 

1 1 1 


RE exp/(In(x)) E exp(In(x)) x` 


Autre exemple, sachant que la fonction tangente est déri- 
vable et que 


tan’(x) = 1 + (tan(x))?> 0, 


on en déduit que sa réciproque arctangente est dérivable 
et que 


, 1 1 1 
acetat a) tan'(arctan(x)) 1+ tan(arctan(x))? = 1+x2` 
Sur le même modèle, vous pourrez traiter arcsinus et arc- 
cosinus. 

Enfin, prenons f(x) = x" (pour n > 1), de sorte 
que f'(x) = nx"-!. Cette dérivée s'annule en 0 (pour n > 2), 
donc pour appliquer le théorème il faut se restreindre 
à ]0,+cœ[. On en déduit que la réciproque, c'est-à-dire la 
fonction f-!(x) = V/x, est dérivable pour x > 0 et que 


n 


-1y _ 1 -— 11 Ve 
PRE en eo © net ” V9 


En 0, cette fonction n’est pas dérivable, voir l'exemple 6.4. 


FONCTIONS À VALEURS VECTORIELLES 
[DM] 


Soit I C R, et soit f : I — R”, qui est donc de la forme 


t H> f (t) = (AE PRE- fat). 


Pour définir la dérivée d’une telle fonction, deux alternatives 
peuvent venir à l'esprit; et la proposition suivante affirme 
qu’elles coincident. 


Proposirion 6.23 — Avec les notations ci-dessus, les deux proprié- 
tés suivantes sont équivalentes : 


1. chaque fonction f; est dérivable au point to; 


2. la fonction 


=i 
possède une limite lorsque t — to. 


Dans ce cas, la limite en question est 


(fi (to) -> fa(to)), 


que l’on appelle le vecteur dérivé de f en to; on le note f'(tg). 


Rappelons que la notion de limite de fonction à valeurs vec- 
torielles a été donnée dans la définition 4.26. Il faut bien com- 
prendre que lorsque l’on forme 


f (t) = f (to) 


t-to `” 


le numérateur est une différence de vecteurs (ou de matrices- 
colonnes, si l'on veut), alors que le dénominateur est un sca- 
laire. C'est-à-dire que 


f(t)=f(to) A filt) - fi (to) 


t-to = 


R- 


Ayant réalisé ceci, la démonstration est facile. 


ExEMPLE 6.24 - Une fonction de la forme y: I > R?, donc 
de la forme 


t > y(t) = (x(t), y(t)), 


est appelée une courbe. La dérivée, lorsqu'elle existe, est 


t => y (t) = (x(t) y (0), 


et y'(t) est appelé le vecteur-vitesse à l'instant t : en effet on 
peut penser à Y comme à un point qui se déplace dans le 
plan. La vitesse à l'instant t est 


Iy I= yx)? + y'(t)?. 


Par abus de langage, l'image de y, c'est-à-dire l'ensemble 


Y() =(y(t) [t eD, 


est parfois également appelé une courbe. Au point y(t), on 
peut tracer la droite de vecteur directeur y'(t), qui est ap- 
pelée la tangente à la courbe à l'instant t. Nous allons étu- 
dier quelques courbes dans les exercices. Ça se fait sim- 
plement en étudiant séparément les fonctions t H> x(t) 
et t => y(t). 


Les propriétés usuelles des dérivées restent vraies pour les 
fonctions à valeurs vectorielles, par exemple il est clair que ( f + 
gy = f +g. Il n'y a pas de formule pour le produit, puisque le 
produit de deux vecteurs n'est pas en général défini. 

Par contre, on peut considérer les fonctions dont les va- 
leurs sont des matrices, c'est-à-dire les fonctions du type I > 
Mm (R). On peut identifier M„ ,„(R) avec R™”, et ce qui pré- 
cède s'applique. On a alors sans surprise : 


Lemme 6.25 — Si f: I => M, Ô (R) et g: Ï — M e(R) sont déri- 
vables, alors f g: I => M,e(R) est dérivable et 


(f g)'(t) = f'(t)g(t) + Fg E). 


La démonstration peut se faire directement par le calcul, 
en se basant sur la formule pour les fonctions à valeurs réelles 
(voir la proposition 6.5). 

Par contre, il faut faire attention à une chose : le théorème 
des accroissements finis concerne strictement les fonctions à 
valeurs réelles, et n'a pas d'équivalent pour les fonctions vecto- 
rielles. Il reste néanmoins vrai que si une fonction dérivable f 
sur un intervalle I vérifie f'(t) = 0 pour tout t € I, alors f est 
constante : en effet il suffit de le vérifier pour chaque compo- 
sante de f. 

Enfin, concluons en indiquant que ces dernières remarques 
sur les fonctions à valeurs vectorielles ou matricielles restent 
vraies en remplaçant R par C. 


voir l'exercice 
5524 


Chapitre 7 


Formules de Taylor 


INTRODUCTION 
EE M] 


Soit f une fonction définie sur un intervalle I contenant 0. 
Nous allons examiner les conditions de continuité et de dériva- 
bilité en 0 sous un angle un peu nouveau. 

La fonction f est continue en 0 si et seulement si lim f(x) = 
f(0) lorsque x > 0. Dans ce cas, on peut écrire, même si ça 
parait artificiel pour l'instant, que 


f(x) = f (0) + e(x), 


avec e(x) = f(x) - f (0); on observe alors que e(x) > 0 lorsque 
x > 0. En d'autres termes, la fonction f se rapproche de la 
valeur (constante) f(0) lorsque x s'approche de 0. On ne sait 
pas à quelle vitesse cette approche se fait. 

De la même manière, le lemme 6.7 nous dit que si f est 
dérivable en 0, alors 


f(x) = f (0) + f (0) x+ xelx), 


où là encore e(x) — 0 lorsque x > 0. Écrivons P(x) = f(0) + 
f'(0)x; c'est un polynôme en x, de degré 1. Comme nous le fai- 
sions remarquer après le lemme 6.7, la différence f(x) — P(x) = 
xe(x) est le produit de deux fonctions qui tendent vers 0 avec x, 
et on peut donc considérer que P est une approximation assez 
bonne de f. 

Géométriquement, le graphe de P est la droite passant par 
(0, f (0)) et dont le coefficient directeur est f’(0); c'est la droite 
tangente au graphe de f. On en sait donc un peu plus sur la 
façon dont f approche la valeur f(0) lorsque x > 0. 

Le but de ce chapitre est de montrer que l’on peut continuer 
dans cette voie : on peut trouver, en supposant que l’on peut 
dériver f au moins n fois, un polynôme P,(x) de degré < n tel 
que la différence f(x) - P,(x) tende vers 0 encore plus vite. 

C'est utile dans de nombreux calculs : nous allons être ca- 
pables de calculer des limites qui restent inaccessibles par les 
autres méthodes classiques. En fait, presque n'importe quel 
calcul de limite va se ramener à une limite de polynômes! 


LA FORMULE DE TAYLOR-LAGRANGE 
EE 


Il y a un certain nombre de formules, dites « de Taylor », qui 
ont toutes pour objectif l’approximation d’une fonction par un 
polynôme, comme annoncé dans l'introduction. Nous en ver- 
rons deux, il en existe encore d’autres. 


THÉORÈME 7.1 (TAyLOR-LAGRANGE) — Soit f une fonction déri- 
vable n fois sur un intervalle I contenant 0. Alors Yx € I il existe 
© €]0, 1 tel que : 

) 0e ten) 


fa) =f (0) + f'(0)x + PAU 4... (FE)! o 


(Attention : O dépend de x et de n.) 


Démonstration. On va faire la démonstration pour x > 0, pour 
simplifier. 

On peut toujours trouver un réel A (qui dépend de x!) tel 
que 


f(x) = f(0)+ f'(0)x +-+ ~ 
(En effet il suffit de poser A = (f(x) -(f(0)++---))/(x"/n!).) On 


veut montrer que A = f ™(Ox) pour un certain 0 < 0 < 1. 
Sur l'intervalle [0, x], on définit 


F: tH> f(x)-1f(t) + f'(t)(x-t)+ 


f(-VD(t) n A i 
EE ES „Ç (x L) a 


Cette fonction F est dérivable, on a F(0) = 0 par choix de A, 
et F(x) = 0. Le théorème des accroissements finis donne l'exis- 
tence de c €]0, x[ tel que 

F(x) - F(0) 


F'(c) = => > 


=Ü; 
x-0 


En posant 0 = £, on a bien 0 < O < 1 et c = Ox. 
Calculons maintenant F'(t) (les détails vous sont confiés en 
exercice) : 


(x= t)! 
(n-1)! 


(n) 
Ç (x sy 1 Te t)" _ (a-fe) 


Donc l'équation F'(0x) = 0 que nous avons obtenue donne A = 
f) (0x), comme on le souhaitait. 


Pour n = 1, noter que cette formule redonne exactement 
le théorème des accroissements finis (un tout petit peu refor- 
mulé). 


ExEMPLE 7.2 — Prenons la fonction f(x) = e*. Ona f' =f, 
et donc aussi f” = f et par récurrence f") = f pour tout n. 
En particulier f")(0) = 1. La formule de Taylor-Lagrange 
donne donc, pour tout x € R et tout entier n , l'existence 
d’un nombre 0 < O < 1 (qui dépend de x et de n) tel que 


x x2 n-1 6x 
x) =ë =UV#x+ > sè + + Xe 
ft) 2 (n-1)! = nl! 


En guise d'application, essayons de fixer x et de faire 
tendre n vers l'infini. Si on observe que [e°*| < el9x| < ebl, 
on en tire 


n 
Puisque BP — 0 lorsque n > +œ (toujours avec x fixé), on 


en déduit 


On retrouve la définition de l’exponentielle telle que nous 
l'avions donnée (définition B.1, pour ceux qui ont pris 
connaissance de l’appendice B). De plus, nous avons sim- 
plement utilisé le fait que f' = f et f(0) = 1, donc nous 
retrouvons la partie « unicité » du lemme B.4. 


ExEMPLE 7.3 - Prenons maintenant une fonction pour la- 
quelle nous ne connaissons pas encore de développement 
en série : par exemple f(x) =In(1+x), définie sur ]-1,+00[. 
On a 

1 


/ 1 ” 
f (x) => donc f (x) =-7 +x et f(x) = 


(1+ x)3 ` 


On peut montrer que f(x) =(=1)"1!(n=1)!(1+ x)"; en 
fait en dérivant cette formule on obtient tout de suite la 
forme de f"+!(x), d'où le résultat par récurrence. En par- 
ticulier, on a f™(0) =(=1)"-!(n-1)!. 

La formule de Taylor-Lagrange donne l'existence pour 
tout x et tout n d’un nombre 0 < 6 < 1 tel que 


2 3 x4 xl (=1)#+1 x" 


— = x * ... n 
f (x) =In(1+x) = x 2 +3 zt +(=1) n= T Ale 


Là encore, fixons x et faisons tendre n vers +0, pour voir. 
On va se restreindre à x € [0,1], et en particulier |x"| < 1. 
Dans ce cas on a 


(-1 yn xn 


CT Ig 
n(1+0x)"| n 


n >o 


Ce qui signifie pour tout x € [0,1] que : 


n-1 - Ë xk +00 : Lx 
In(1+x)= lim Y (TE + NAZ: 
k=1 k=1 


(Il est possible de montrer que ceci est vrai pour tout x 
dans l'intervalle ]=1,1], mais nous ne le ferons pas ici.) 
C'est cette formule qui est utilisée par les calculatrices 
pour calculer un logarithme! Notons pour x = 1 que l'on 
a 


+00 k-1 
—1 1 1 1 
In(2) => ( L = 1 zt + 
k=1 


Nous avions annoncé ce résultat dans l'exemple 3.23. 


LA FORMULE DE TAYLOR-YOUNG 
[P=] 


Dans les exemples ci-dessus, nous avons fixé x et étudié le 
« reste », c’est-à-dire le terme en x”; c’est typique de l’utilisa- 
tion de Taylor-Lagrange. Voici maintenant la formule de Taylor- 
Young, qui va être utilisée lorsque l’on veut faire tendre x vers 0 
pour calculer une limite. 


THÉORÈME 7.4 (TAYLOR-YOUNG) - Soit f une fonction dérivable n 
fois sur un intervalle Ï contenant 0. Alors on peut écrire 


F = f(0)+ LC LLD 12 4.2.4 LLD q eiea) 


où e(x) — 0 quand x — 0. 


Démonstration. La démonstration complète sera donnée plus 
loin (voir le théorème 8.36). Ici nous donnons une démonstra- 
tion avec une toute petite restriction : on va supposer que, en 
plus des hypothèses ci-dessus, la fonction f™ est continue en 
0. C'est par exemple le cas si f est dérivable n+1 fois, et en pra- 
tique dans tous nos exemples nous serons dans cette situation. 

On a alors f(x) > f™(0); en d'autres termes, si on pose 
h(x) = f !M(x) =f!) (0), on peut écrire f(x) = f!) (0)+h(x) avec 
h(x) — 0. La formule de Taylor-Lagrange donne alors : 


f" (0) nr À f (0) n + x"h(O,x) 
(n-1)! n! n! ` 


f(x) =f(0) +++ 


On rappelle encore que 8 = 0, dépend de x. Posons alors e(x) = 
h(0,x)/n!. Comme 0 < 8, < 1, on a e(x) > 0 lorsque x > 0, ce 
qui conclut la démonstration. 


ExEMPLE 7.5 - Avant de connaitre les formules de Taylor, 
calculer une limite relève souvent de l'astuce. Par exemple 
essayons de calculer la limite de Saa lorsque x — 0. 
L’astuce consiste à remarque que, si f(x) = cos(x), alors la 


quantité étudiée est le taux d’accroissement de f : 


cos(x) — 1 = f(x) - f (0) > f'(0)=0. 


x x-0 


Si maintenant nous essayons de calculer la limite de 
cos(x)-1 ^ 2 y 
=>>-- en 0, la même astuce ne donne rien. Pour parvenir 
à faire le calcul, écrivons la formule de Taylor-Young pour 
la fonction f définie par f(x) = cos(x) et pour n = 2 (on dit 
souvent « Taylor-Young à l’ordre 2 »). On a f(0) = 1, f’(0) = 
0 et f”(0) = —1. Par conséquent : 


32 
f (x) = cos(x) = 1- 5 x?e(x) 
avec e(x) — 0. Et donc: 
cos(x) — 1 _ 1 HU- 1 


x2 


Ainsi, la formule de Taylor nous a permis de « remplacer » 
la fonction cos par le polynôme 1 - E dans le calcul de la 
limite. 

Au passage, il est très facile d'écrire la formule de 
Taylor-Young pour la fonction cos à n'importe quel ordre, 
puisque les dérivées successives sont : 


(3) 


en . ” _ Li at (4) _ 
COS =- SIN, COS =- COS, COS =Sin et cos = COS. 


Les nombres cos.) (0), lorsque n augmente, sont donc 
1,0,-1,0, 1,0,-1,0, 1,0,-1,0,..., 


la séquence 1,0,-1,0 se répétant sans cesse. En particulier 
les termes « impairs » dans la formule de Taylor-Young sont 
nuls, et la formule à l'ordre 2n + 1 est 


x2 xt x6 x2" 


Z ...3 (1)! 2n+1 
cos(x) =1=>F-+7 =+ +(-1) En ** e(x), 


où e(x) > 0 lorsque x > 0. 


ExEMPLE 7.6 -On souhaite calculer la limite en 0 
de ne. Écrivons d’abord la formule de Taylor-Young 


pour la fonction sinus : les dérivées successives sont 


sin/=cos, sin”/=-sin, sin =-cos et sin) =sin. 


Les nombres sin”) (0), lorsque n augmente, sont donc 
0,1,0,=1, 0,1,0;=1, 0,1,0,-1,.... 


En particulier les termes « pairs » dans la formule de 
Taylor-Young sont nuls, et la formule à l'ordre 2n est 


3 „5 „7 2n-1 
| = x x a.. (11 x 2n 
sin(x) = x — 31 + T7 +++ (=1) 2n)! +x"e(x), 


où e(x) > 0 lorsque x > 0. Pour notre limite, prenons 
l’ordre 4: 
x3 4 
sin(x) = x — z + x"e(x), 


où, vous l'aurez deviné, on a e(x) — 0. Ainsi 


nu = + x?e(x) — 0. 
x 6 


ExEMPLE 7.7 - Un dernier. Essayons de calculer la limite de 


VI +2x- V1+3x 


x2 


, 


lorsque x tend vers 0. Introduisons la notation f„(t) = (1 + 
t)“, pour œa > 0, et calculons la formule de Taylor-Young 
pour fa. On a 


=al tA, a (t) =a(a -1)(1+t)*7?, 
et par récurrence on a facilement 
ft) =a(a=1)(a-2)-+-(a=n+1)(1+ t)&-". 
Le coefficient qui apparait dans Taylor-Young est donc 


f Ho)  a(a-1}(a-2)-.(a-n+1) 


, 


n! n! 


et ce nombre est souvent noté (f), ce qui est cohérent avec 
la notation lorsque aœ est un entier. On a donc 


-1 
(1+t)% = trate SED 241.4 ENT 
n 


avec e(t) — 0. Pour œa = E et n = 2, on obtient 


1 r? 
VI+t=(1+t)?=1+ 5t- g +t al). 
Pour t = 2x ceci donne 
2 


x 
V1+2x=1+x- = +4x?°e1 (2x). 
Vous montrerez qu’en prenant a = l on en arrive à 


V1+3x= 1+x-x2+9x2e,(3x). 


Finalement l'expression dont on cherche la limite est de la 
forme 
1x? +x?h(x) 1 
5 = —+h(x), 
x 2 
où h(x) est une certaine expression qui tend vers 0 avec x. 
La limite vaut L. 
Si vous avez trouvé ce dernier calcul un peu compli- 
qué, alors vous conviendrez qu'on aurait besoin de nota- 
tions plus simples, et de quelques conseils pratiques. 


DÉVELOPPEMENTS LIMITÉS 
[a] 


Les expressions telles que 4x?°e; (2x) ci-dessus sont rapide- 
ment pénibles à manier. Donner des noms différents aux fonc- 
tions qui tendent vers O qui apparaissent (£1, €2, ...) devient 
vite compliqué, et on se demande s’il est vraiment utile de bap- 
tiser toutes ces fonctions. On ne peut pourtant pas outes les 
nommer de la même manière. 

Pour résoudre ce problème, on introduit la notation de Lan- 
dau, qui en toute rigueur est un peu ambigüe, mais en pratique 
économise bien des efforts. Elle fonctionne de la manière sui- 
vante : tout d’abord on écrit 


o(1) 


qui se prononce « petit o de 1 », pour désigner une fonction 
anonyme qui tend vers 0. On ne dit pas « quand qui tend vers 
quoi », c'est pourquoi la notation est ambigüe, mais c’est le 
contexte qui rend les choses claires. 

Ensuite, étant donnée une fonction $, qui en pratique sera 
très souvent de la forme f(x) = x", on utilise le raccourci 


Par exemple o(x") désigne une expression de la forme x"e(x) 
avec e(x) > O (et ces expressions sont beaucoup intervenues 
dans le début de ce chapitre !). Ainsi on peut énoncer la conclu- 
sion du théorème de Taylor-Young sous la forme 


F'O 2,,., #00) 


f (x) = f(0) + f'(0)x+ Z - 


x" +o(x"). 

On peut penser à o(b(x)) comme à « quelque chose de né- 
gligeable devant f(x) ». 

Avant de voir cette notation à l'oeuvre dans un calcul, une 
petite définition : 


DériniTIoN 7.8 -On dit que f a un développement limité à 
l’ordre n au voisinage de 0 s’il existe ag,...,a„ € R tels que 


D) = (M T O see ee 0 Eu) 
0 


Le théorème de Taylor-Young affirme donc que si f est dé- 
rivable n fois, alors elle possède un développement limité à 


(k) n 
l’ordre n, et de plus aç = ro, Mais utiliser le théorème n'est 


pas toujours la meilleure façon de trouver un développement 
limité - en fait, presque jamais. 


ExEMPLE 7.9 - En écrivant (1-x)(1+x+x2+...+x") =1-x"#1, 
on tire 


n+1 


1 2 n 
— =Îl+X+X ++ x + 
1-x 1-x 


=1+x+x? +- +x" +o(x"). 


Ici on a utilisé le fait que -È — 0 lorsque x — 0, ce qu'on 
résume en écrivant 7% = 0(1); et donc ue = o(x”). 

Bien entendu on peut obtenir ce développement grâce à 
Taylor-Young, ou encore en utilisant celui de (1+t)" comme 
dans l'exemple 7.7 pour œ = -1 et t = -x. Mais le plus 
simple pour le retrouver reste le calcul ci-dessus. 


ExEMPLE 7.10 - Cherchons un développement limité de la 
fonction x => (e*—1)(sin(x) - x) en 0 à l’ordre 4. On écrit 


3 
e—-1=x+o(x) et sin(x) x ==" + o(x3); 


en effet nous connaissons ces développements par cœur 
depuis les exemples 7.2 et 7.6. 
En multipliant il vient 


4 x3 
(e* =1)(sin(x) — x) = + 6 o(x) + xo(x?*) + o(x)o(x?)|. 


Maintenant nous faisons une série de petites simplifica- 
tions, qu'il va falloir s'habituer à faire de tête (c'est très 
facile). Tout d'abord 


Pour la deuxième égalité, on utilise le fait que -lo(1) = 


o(1), ce qui signifie seulement que -Lo(1) tend vers 0 
avec x. 

Deux autres petits calculs donnent de la même ma- 
nière xo(x3) = o(x*) et o(x)o(x$) = o(x*). Enfin la somme 
des termes dans le crochet est 


o(x*) + o(x*) + o(x4) = x*(o(1) +o(1)+o(1)) = xto(1) = o(x*). 


Ici on utilise le fait que o(1)+ o(1) = o(1) (ce qui surprend 
la première fois !). Finalement 


ProposIiTION 7.11 - Si l'on peut écrire : 


f(x) 


ao +41X+-.-+4,X"+0(x") 
= bo+bix+-..+b,x"+o(x") 


alors a; = b;. En d'autres termes, lorsqu'un développement limité 
existe, il est unique. 


Démonstration. Par récurrence sur n. Pour n = 0, on prend la 
limite quand x tend vers 0, et on obtient ag = bo. 

Si l'unicité a été prouvée pour n- 1 et que l’on a un déve- 
loppement limité à l'ordre n, on écrit a,x" + o(x") = o(x"-!) et 
de même pour b„, et on obtient 


f(x) 


n-1 n-1 


Ag +Aajx+ >> +Aay_1x""> + o(x 
bo + bx + >>> + bu -1x" 1 + o0(x"-1). 


Par récurrence on a a; = b; pour 0 <i <n-1. 

On peut donc simplifier l'égalité ci-dessus, et il reste a„x" + 
o(x") = b„x" + o(x"). On divise par x” et on prend la limite en 
0 : il vient a„ = bq. 


ExEMPLE 7.12 -Cette proposition est utile, bien sür, 
lorsque nous avons deux façons de trouver un déve- 
loppement limité. Par exemple, considérons la question 
suivante : soit f(x) = zz; combien vaut f(6)(0)? On 
peut bien sûr répondre à cette question en dérivant 6 
fois... mais c'est très long. Procédons autrement. 

D'après Taylor-Young, nous savons que cette fonction 
possède un développement limité à tous les ordres, et le 


k (0) 


terme en x" est précisément Í Ti xk. Mais nous savons 


aussi que 


1 2 2 
—— =1+u+u"+o(u*), 
Tu (u°) 


depuis l'exemple 7.9, donc en prenant u = -2x : 


1 


= 1 2x +4x6 + o0(x*). 
1+2x3 


Détaillons un peu ce qui vient de se passer avec le reste. Le 
terme o(u?) s'écrit donc u?e(u) avec e(u) — 0 lorsque u > 
0. Lorsque l'on fait u = —2x°, ce terme devient 4x$e(—2x), 
et cette expression est bien de la forme x6o(1) = o(x$). Là 
encore il faut faire ça de tête, avec l'habitude. 

D'après la proposition, on peut comparer ce développe- 
ment limité avec celui donné par Taylor-Young, et en par- 
ticulier pour les termes en x la comparaison donne 


f(9(0) 
6! 


=4 donc f(6)(0)=4x6!= 2880. 


MÉTHODES DE CALCUL DES DÉVELOPPEMENTS LIMITÉS 
[j] 


Calculer les développements limités nécessite de l’entraî- 
nement, et nous allons lister quelques techniques à connaître. 
Évidemment la première méthode est d'appliquer le théorème 
de Taylor-Young, mais il est très rare que ce soit le meilleur 
choix. C'est bien sûr grâce à ce théorème que nous avons ob- 
tenu les développements des fonctions usuelles (exponentielle, 
sinus, cosinus...), mais ceux-ci sont à savoir par cœur abso- 
lument, de sorte qu’à partir de maintenant il sera exception- 
nel d'appliquer directement Taylor-Young. (À la fin du chapitre 
nous résumons les choses à mémoriser.) 


ExEMPLE 7.13 (Composirion) - Essayons de trouver un dé- 
veloppement limité de —— à l’ordre 4 en 0. On utilise le 


cos(x) 
fait que : 
1 2 2 
=1l-u+u+o(u*). 
l+u ve] 
Ensuite on écrit cos(x) = 1+u(x) avec u(x) = zg + z +o(x) 
(on a retenu le calcul de l'exemple 7.5 par cœur). 


En combinant les résultats, on obtient 


ï _ i 
cos(x)  1+u(x) 


= 1 — u(x) + u(x)? + o(u(x)?) 


x2 5x4 


=1+=+ Ho). 
2 24 =) 

On a utilisé au passage o(u(x)?) = o(x*). D'une manière 
générale le petit résultat suivant est à retenir : si u(x) pos- 
sède un développement limité qui commence par un terme 
en x”, alors o(u(x)") = o(x"""). 


EXEMPLE 7.14 (INTÉGRATION) - Le principe est le suivant. 
Soit f une fonction dérivable n + 1 fois. D’après Taylor- 
Young, f admet un développement limité à l’ordre n +1, 


(k) 
donc f(x) = 40+a1x+-.+a,,1x"*1+0(x"*l), avec ap = Í Y 


Mais on sait aussi que f' est dérivable n fois, et donc 
admet un développement limité de la forme f'(x) = bo + 
bix +: + b„x" + o(x"), avec cette fois 


NN (k) (k+1) 
= (f E (0) _ f = (D) _ (k+ 1)ak41. 


On peut donc trouver les aj à partir des br (et le contraire 
aussi d’ailleurs, mais en général c'est plus intéressant dans 
ce sens, et c’est pourquoi on parle de la méthode « d’inté- 
gration »). Il reste juste à calculer ag = f (0) directement, et 
on obtient n +1 coefficients du développement limité de f 
à partir de n coefficients du développement de f’. 

Voyons ça pour f(x) = arctan(x). On est bien plus à 
l'aise avec la dérivée f'(x) = =» puisque l'on a 


1 par 
1+x2 


1=x? + xt xó pes (A + o(x?"). 


(On déduit celui-ci du développement de T=» que l'on 

connait par cœur). Pour revenir à f, il suffit « d'intégrer 
terme à terme », c'est-à-dire que l'on a 

3 5 7 x2"+t1 

x)= f(0)+x- => =- Ó +e +(=1)" 

fo) =f(0)+x- E +E -E ++ +(-1) 


Et bien sür f (0) = arctan(0) = 0. 


ExEMPLE 7.15 (TANGENTE) - Il y a de nombreuses façons de 
calculer le développement limité de f(x) = tan(x). La mé- 
thode que nous allons présenter est particulièrement ra- 
pide. C'est un classique qui peut donner des idées dans 
d'autres situations. 

On commence par noter que f'(x) = 1 + tan(x)? = 1 + 
f(x)?. Ainsi f(0) = 0 et f'(0) = 1+0 = 1. Par Taylor-Young, 
nous avons le développement à l’ordre 1, à savoir f(x) = 
x + o(x). 

Mais alors 


f'(x)=1+ f(x)? =1+(x+ 0(x))? = 1 + x? + o(x2?). 


Par la méthode d'intégration, on en déduit que 


x3 


f(x) = x+ z toa’). 


Et on recommence : 


2 
f'(x)=1+ [x+ 2 $ ox?) 


2 
=1+x2+ 3x tol’). 


On intègre de nouveau : 


3 
f(x) =x+ + T X +00). 


On peut continuer comme ça pendant longtemps. Vous 

pouvez vérifier que l'on a 

x 2,5, 17 7, 62 
x x 

3 15 315 2835 


x? + o(x°). 


f(x) = x+ 


Il n'existe pas de formule générale pour l’ordre n. 


LE MINIMUM À SAVOIR PAR CŒUR 


Plus on connaît de développements limités par cœur, plus 
les suivants sont faciles. Dans cet esprit, voici une liste mini- 
male de choses à savoir par cœur sous peine d’être incapable 
d'affronter les exercices. Les démonstrations ont toutes été 
données au cours de ce chapitre. Nous indiquons des moyens 


mnémotechniques. 
2 n 
x x x > 
oe =l+x+->40>+4 => tol) 
7 4 p i 2 
X* X X x 21 
© cos(x) =1 + 854 (=T) Hotel). 
A 2 ‘4 6! CI S +€) 


(On garde les termes pairs de l'exponentielle avec un 


signe une fois sur deux.) 
3 5 7 2n-1 
x” x x x 
sin(x) = x- = + RE +o(x 
o 31 5 71 on (2n—1)! 


(Pareil avec les termes impairs.) 


-1 
(1+x)*=1+ax+ Ds (fat cts) 


anj, 


(« Formule du binôme ».) 
T 1+x+x? +-+ x" + o0(x"). 

-x 
(C’est un cas particulier de la formule précédente, mais il 
est tellement important qu'il faut savoir l'écrire rapide- 


ment.) 
2 „3 


n 
In(1 + x) = x x FA ++ ( 1)! Ž +o(x"). 
5 3 a 
(En dérivant on doit retrouver la formule pour (1 + x) !.) 


Pour arctan, arcsin et arccos, on dérive et on fait un déve- 
loppement de la dérivée à l’aide de la formule pour (1 + 
x)“. 


voir les exercices 
1237, 1239, 
1240, 4019, 
5426, 5427, 
5429, 5430, 
5432, 5433, 
5434, 5437, 
5438, 5439, 
5440, 5441 


Chapitre 8 


Intégrale de Riemann 


INTRODUCTION 
EE 24 


Le problème de départ que nous nous proposons de ré- 
soudre dans ce chapitre est le suivant. Étant donnée une fonc- 
tion f, existe-t-il une fonction F telle que 


F=f ? (*) 


L'équation (*) est le premier exemple d'équation différentielle 
que nous rencontrons. Il s'agit d'une équation dans laquelle 
« l'inconnue » est une fonction, ici F, et la condition sur F fait 
intervenir sa dérivée. Nous verrons que résoudre (*) est une 
première étape importante pour résoudre des équations diffé- 
rentielles plus compliquées. Notons qu'une solution de (*) est 
appelée une primitive de f. 

Il est facile d'étudier l'unicité des solutions, s'il y en a. En 
effet, supposons que f soit définie sur un intervalle I, et que 
nous cherchions F sur I. En présence de deux primitives F et G, 
on observe que (F -GY = F’ -Q = f - f = 0. La fonction F - G 
est alors constante : deux primitives d'une même fonction sur 
un intervalle diffèrent d'une constante, c'est-à-dire que G(x) = 
F(x)+c pour xe I. 

Le point délicat est de montrer que, sous certaines condi- 
tions, il existe au moins une primitive. On aimerait également 
pouvoir calculer explicitement les valeurs prises par F. Dans ce 
chapitre nous allons démontrer qu'une primitive existe lorsque 
la fonction f est continue. 

La stratégie est la suivante. Supposons que F' = f, que 
F(xo) = 0, et examinons la condition F'(x Í) = f(xo). Si l'on 
s'écarte un peu de xg pour atteindre le point x + h avec h « pe- 
tit», alors F(xo + h) est proche de F(xo) + F'(xọ)h = f(xo)h (on 
remplace la fonction par son développement limité à l'ordre 1). 
L'idée est d'interpréter la quantité F(xg + h) = f(x )h comme 
l'aire du rectangle de hauteur f (xo) et de largeur h. De même la 
différence F(xo+2h)-F(xo+h) devrait être proche de F’(xo+h)h = 
f (xo + h)h, qui est l'aire du rectangle de hauteur f (xo + h) et de 
largeur h. Au total F(xg+ 2h) = (F(xo + 2h) — F(xo + h)) + F(xo + h) 
est proche de la somme des aires des deux rectangles considé- 
rés sur le dessin ci-dessous. 


Xo xo+h xo + 2h 


De même pour tout entier k, la valeur F(xọ + kh) est proche 
de la somme des aires de k rectangles. Pour trouver une ap- 
proximation de F(xı) pour xı > xg, on peut découper l'inter- 
valle [xọ,xı] en morceaux de largeur h, et calculer l'aire des 
rectangles obtenus. Lorsque h devient de plus en plus petit, in- 
tuitivement, on obtient l'aire de la zone située entre le graphe 
de f et l'axe des abscisses, et entre les droites verticales d’équa- 
tions x = xp et x = x1. 


Xo X1 


Cette analyse étant faite, pour définir la fonction F, il reste 
à définir rigoureusement ce qu'on entend par «aire ». C'est 
ce que nous allons faire, et nous l’appellerons l'intégrale de f, 
entre deux bornes données (sur le dessin, xg et x1). Nous pour- 
rons alors poser F(x) = l'intégrale de f entre x, et x, et nous 
montrerons (assez facilement) que ce procédé donne bien une 
primitive de f. 

Nous obtenons au passage une application intéressante, qui 
est celle que vous avez étudiée en Terminale : dans de nom- 
breux cas, c'est le calcul de l'aire qui nous intéresse, alors que 
l’on peut trouver une primitive directement. La relation entre 
«aire » et « primitive » est utile dans les deux sens. 


FONCTIONS INTÉGRABLES AU SENS DE RIEMANN 
EE 


On fixe un intervalle compact [a, b]. Les premières fonctions 
pour lesquelles on peut définir facilement ce qu'est « l'aire sous 
la courbe » sont les fonctions « en escaliers » : 


DÉFINITION 8.1 - Une fonction $ sur [a,b] est dite en escaliers 
lorsqu'il existe des nombres ag = a < aj < az < ++: < a, = b tels 
que b est constante sur chaque intervalle ouvert ]a;, a;41[. 

La famille a = (ap,4,,...,a,) est appelée une subdivision 
(adaptée à q). 


Voici un exemple de fonction en escaliers. 


F + 
| l 
| + 
I x I I I 
I l I | I 
l l l | l 
l l l | l 
| Â t | l 
| | l | l 
| E 71 
l l J 

l | l 
| | k | h 
l l í Í 
! 1 1 4 
40 a] ao 43 44 


Notez que la valeur de | en a; peut être quelconque, in- 
dépendamment des valeurs prises sur ]a;_1,a;[ et Ja;,a;,1[. Sur 
cet exemple on voit bien que la subdivision a = (aọ, 41, 42, 43,44) 
n'est pas unique : en effet | est en réalité constante sur Jaz, 44[, 
et on aurait pu prendre la subdivision 4’ = (ag, 41,42,44). 

On peut alors poser la définition suivante : 


DÉFINITION 8.2 — Soit | en escaliers, et a = (4,...,4,) une sub- 
division adaptée. Soit a; la valeur de ọ sur ]4;,a;,1[. On pose : 


I(d,a) = (a;41 — a;)ai. 


Ce nombre est bien « l'aire » des rectangles définis par | 
(avec cependant la possibilité que a; soit négatif). Géométri- 
quement on s'attend donc à ce que I(b) ne dépende pas du 
choix de la subdivision. C'est le cas : 


Lemme 8.3 — Le nombre I(,a) ne dépend que de b et pas du choix 
de la subdivision a. 


On va donc pouvoir utiliser la notation I(). 


Démonstration. Étudions un premier cas simple : si a’ est obte- 
nue à partir de a en retirant un point a;, comme dans l'exemple 
ci-dessus, nous allons montrer que I(,a’) = I(,a). En effet, la 
fonction $f est alors constante sur ]4;_1,4;,,[ de sorte que dans 
la somme définissant I(@,a), on a deux termes qui se simpli- 
fient : 


(ais — ai); + (a; — ai 1)ai 1 = (ais —aÿ 1)ai 1, 


puisque a;_, = a;. L'égalité I(, a’) = I(b,a) est alors claire. 

En répétant l'opération, on constate que si a’ est obtenue 
à partir de a en retirant plusieurs points, alors on a I(@,a') = 
I(, a) là encore. 

Finalement, soient a et a’ deux subdivisions quelconques 
(adaptées à p). On définit une nouvelle subdivision a” en pre- 
nant tous les points de a et de g’, et en les rangeant dans l’ordre. 
Alors a est obtenue à partir de 4” en retirant les points de 4’, 
donc I(,a”) = I(b,a); et a’ est obtenue à partir de a” en reti- 
rant les points de a, donc I(@p,a”) = I($, a"). Finalement I(@, a) = 


I(d, a’). 


Lorsque @$ et 1 sont deux fonctions (quelconques) sur [a, b] 
telles que (x) < p(x) pour chaque x € [a,b], on écrira simple- 
ment  < vV. La propriété suivante est très utile : 


Lemme 8.4 — Si f et w sont en escaliers, et si H < w, alors I(P) < 


(v). 


Démonstration. Soit ag < aj < + < a„ une subdivision telle que 
$, resp. p, est constante de valeur aj, resp. ai, sur Ja;,a;,1|. 
Grâce au lemme précédent, on peut utiliser cette subdivision 
(qui n’est pas forcément minimale) pour calculer les I. Par hy- 
pothèse on a a; < a’, donc 


comme annoncé. 


Il est bon de noter qu'on ne change pas I() si on change 
la fonction |@ en un nombre fini de points. De même, si ọ¢(x) < 
p(x) pour tous les x dans [a,b] sauf pour un nombre fini de 
valeurs x = x1,...,x = x4, alors on peut quand même conclure 
que I(b) < I(W). Dans ce qui suit, on va utiliser ce genre de 
simplifications de manière implicite. 

Nous arrivons à la définition de l'intégrale de Riemann. Soit 
f une fonction quelconque, bornée, sur [a, b]. On définit 


T*( f) = inf{I(p) | p en escalier telle que 4 > f} 


et 
I (f) = sup{I(b) | | en escalier telle que D < f}. 


D'après le lemme précédent, la relation | < f < 4 donne I{b) < 
I(b), et par suite (f) <I*(f). 


DÉFINITION 8.5 - Lorsque I (f) = I*(f), on dit que f est inté- 
grable au sens de Riemann, et on note 


b 
Í 
a 
la valeur de IÈ(f), que l'on appelle intégrale de f sur [a,b]. On 


note aussi parfois 
b 
| f(t)dt. 
a 


Ici la variable t est muette, et peut être remplacée par n'importe 
quelle lettre, souvent x ou y ou u... 


Noter que la définition contient un sup, et un inf. Ceci est 
possible car les sup et les inf existent dans R, comme nous 
l'avons vu. La théorie des intégrales atteste, à nouveau, de l'im- 
portance de cette propriété des nombres réels. 


Lemme 8.6 - Lorsque f est en escaliers, on a 


É = 1(f). 


Démonstration. On peut prendre D = f, et p < f donne I" (f) > 
I(h) = I(f). De même, en prenant 1 = f on obtient I*(f) <I(f). 
Ainsi, ona I (f)>I*(f), d'où I-(f)=I*(f) = I(f). 


PREMIERS EXEMPLES DE FONCTIONS INTÉGRABLES 
| 


Notre premier objectif est de trouver d’autres exemples de 
fonctions intégrables, en dehors des fonctions en escaliers. La 
définition ci-dessus est très concise, et montre de manière ex- 
plicite l’utilisation de sup et de inf, mais pour montrer concrè- 
tement qu’une fonction donnée est intégrable on va utiliser le 
critère simple suivant. 


Lemme 8.7 — Soit f une fonction sur [a,b]. Alors f est intégrable 


<> il existe deux suites (P„)n>o et (Wn)n>o de fonctions en esca- 
liers telles que Pn < f < Yn, et telles que 


b b 
lim ha- | Pn =0. 
a a 


+00 


b b b 
J C= im foin f, ve 


Démonstration. Commençons par =. De p, < f on tire I-(f) > 
| Pn par définition ; de même I*(f) < | pq. On tire 


On a alors 


0< 1-1) < fu fé, 


En passant à la limite sur n, on obtient bien I*( f) =I-(f), cest- 
à-dire que f est intégrable. 

Maintenant regardons =>. Soit n un entier > 1. Comme 
(f) - < (f), on sait par définition du sup (= le plus pe- 
tit des majorants d'un ensemble) qu'il existe une fonction en 
escaliers |@„ telle que D, < f et telle que I(|„) > I (f)- 1. De 
la même manière, il existe 1», en escaliers telle que p, > f et 
telle que I(W,) < I*(f) + 1. Si f est intégrable on a I*(f) = I-(f) 
et donc 


os f n fe, <r +)-(ro-4)-2 


(la première inégalité provient du lemme 8.4). En passant à la 
limite, on obtient le résultat. 
Pour finir, de l'inégalité b, < f < Pn, on tire 


L'usfrefe 


par définition même de l'intégrale. En écrivant ceci sous la 


Re b b b b 
safe fans Lu [ro 


et en faisant tendre n vers l'infini, on obtient bien la formule 
souhaitée. 


Par exemple on peut utiliser ce résultat pour montrer : 


ProposirioN 8.8 — Soit f une fonction monotone sur [a,b]. Alors 
f est intégrable. 


Démonstration. On va faire la preuve dans le cas où f est crois- 
sante. Le cas où elle est décroissante est similaire. 

Soit n un entier > 1. On va découper [a,b] en n morceaux 
en posant 4; = a+i ( ba), pour 0 < i < n. On définit maintenant 
deux fonctions en escaliers D,, resp. Yn, qui sont constantes 
sur chaque intervalle ]a;,a;„1[ de valeur f(a;), resp. f(ai+1). 


Par croissance de f, on a |„ < f < pp. Calculons maintenant 
b : DA 
Í. Pn = ID) directement avec la formule définissant I : comme 


Aj41 — 4j = ba, on obtient 


"e Y e) 


a i=0 
De même 

b Ü n-1 

Vn = Y faim) 

4 i=0 

On tire A 2 
b) - 
Fu f qu = EIH X- a) 


On fait ensuite tendre n vers l'infini, et les conditions du 
lemme 8.7 sont réunies. Donc f est intégrable. 


Cette démonstration est illustrée sur le dessin suivant. 


Vn 


ExEMPLE 8.9 - Prenons f (t) = t sur [0,1]. Elle est croissante, 
donc intégrable, et on peut même calculer son intégrale 
grâce au procédé décrit dans la démonstration. En effet 


dans ce cas on a @„(t) = i sur l'intervalle L, LÇ, Par suite 
n-1 . j è n-1 
1 1+1 í 1 | 
Uda) <> zx n 5) = n? L" 
i=0 i=0 
Or comme vous le savez on a 
n-1 
: n(n-1 
à =0+1+2+3+-+++(n-1) = ( 3 ) 
i=0 
Ceci donne 
(3 ea 
Pn 2 2n 


et 


1 
. 1 
|, tdt = lim Iu) = 3. 


ExEMPLE 8.10 — Prenons maintenant f(t) = ef sur [0,1]. Là 
encore f est croissante donc intégrable, et cette fois on a 
(toujours avec les notations de la démonstration) @„(t) = 


L i i+l < 
en sur JE, |. Ici 


f 1 
Sion pose a =e", ona 


n-1 i n 1 
1 Vf _ 2 n-1 _ = RÉ 

en] =1+a+a + +a ` = = T: 
l-a l= 


Il 
5 


Utilisons le développement limité e” = 1 + u + o(u). On en 
tire er =1+ 1 + o(1), d’où 

1 I= l-e 
“a -1 +o(}) Ta +o(1) 


In) 


En passant à la limite, on obtient 
1 
f e'dt=e-1. 
0 


On a donc déjà un grand nombre d'exemples de fonctions 
qui sont intégrables, comme l'exponentielle, le logarithme, etc. 
Noter que l'on ne suppose même pas que f est continue dans 
la proposition. 

Pour ce qui est des autres fonctions « usuelles », comme le 
sinus et le cosinus par exemple, on peut remarquer que sur un 
intervalle compact [a,b], même si elles ne sont pas forcément 
monotones, on peut découper [a,b] en un nombre fini de sous- 
intervalles sur lesquels ces fonctions sont monotones. Les pro- 
priétés élémentaires des intégrales, que nous allons voir tout 
de suite, vont alors montrer que ces fonctions sont également 
intégrables. 


PROPRIÉTÉS ÉLÉMENTAIRES 
[Ma 


Commençons par la « relation de Chasles » : 


ProPosirion 8.11 = Soit f une fonction sur [a,b], et soit x € [a,b]. 
Alors f est intégrable sur [a,b] => f est intégrable sur [a, x] et sur 
[x, b]. 

De plus, on a la relation dite de Chasles : 


NEZ 


Le schéma de la démonstration est à retenir : on va le réuti- 
liser constamment. 


Démonstration. On commence par traiter le cas oà f est en es- 
caliers. Alors f est intégrable partout, donc il y a seulement la 
relation de Chasles à montrer. En utilisant la formule pour I, 
on s'aperçoit que le résultat est évident. 

On passe au cas général. Montrons =>. On suppose que f 
est intégrable sur [a,b], et on prend b, et 4, comme dans le 
lemme 8.7. La relation |„ < f < 4, étant valable sur [a, b], elle 
est aussi valable sur [a, x] et [x, b]. De plus, comme tb, et 4, sont 
en escaliers et que l’on a une relation de Chasles dans ce cas, 
on a: 


f wf n = Ce S ou S du f o) 


Les termes entre parenthèses sont > 0 car þa < 4, et on a le 
lemme 8.4. 
En particulier on a 


0< f n- fe <f f e 


et en faisant tendre n vers +0, on obtient 


Donc le lemme 8.7 (dans le sens ==!) nous dit que f est inté- 
grable sur [a, x]. De même entre x et b. 

Montrons maintenant <=. Notons fı la restriction de f à 
[a,x]. On suppose fı intégrable, donc on peut choisir des suites 
ni et V„i comme dans le lemme 8.7. De même, on définit f2, 
Pn,2 et Pn o sur [x,b]. On recolle les morceaux, en définissant 
Pn sur [a,b] par P„(t) = Pni(t) sit E [a,x], et a(t) = Pn,2(t) si 
t e]x, b]; de même on définit p,. 

On veut utiliser encore le lemme 8.7 pour conclure. Véri- 
fions les hypothèses : D, et 1, sont en escaliers; on a bien 
Pn < f < Wu, car on peut vérifier ceci séparément sur [a,x] et 
sur [x,b] et on a supposé que 6,; < f < Phi pour i = 1 ou 
2 ; enfin, la relation de Chasles pour les fonctions en escaliers 
donne encore : 


f pr =h du=(f m= (a): i w- f qu): 


Le terme dans la première parenthèse est en fait 


f be Í du: 


puisque par construction, |„ = ,1 sur [a,x]; de même le 
terme dans la deuxième parenthèse peut s'écrire avec W„ 2 et 
1,2. Donc les termes entre parenthèses tendent vers 0 quand 
n tend vers +00, en on a finalement réuni toutes les hypothèses 
du lemme 8.7, qui nous dit que f est intégrable sur [a,b]. 

De plus, on sait aussi que 


b b x x x 
f f= dim. fév que f f=J f= im, f ôm 
et que 
b b b 
f rf B= En il de 
x x hn—+00 x 


En écrivant la relation de Chasles pour b, (qui est en escaliers) 
et en passant à la limite, on obtient la relation de Chasles pour 
f quelconque. 


ExEMPLE 8.12 — Supposons que f soit une fonction sur 
[a,b], et qu'il existe une subdivision ag = a < aj < +> < a, = 
b telle que f est monotone sur [a; : 4;,,] (par exemple les 
fonctions sinus et cosinus ont cette propriété sur n'importe 
quel intervalle compact). Alors d’après la proposition 8.8, 
f est intégrable sur [a; : a;,1]. En utilisant la proposition 
8.11 (plusieurs fois !), on obtient que f est intégrable sur 
[a, b]. 

On a donc montré que toutes les fonctions dites 
« usuelles » sont intégrables. Par contre nous n'avons en- 
core rien dit sur la façon de calculer les intégrales, bien 
sür. 


Toutes les autres propriétés élémentaires de l'intégrale se 
démontrent de la même manière. On a principalement : 


PropPosirioN 8.13 — Propriétés de l'intégrale : 


1. (Linéarité) Si f et g sont intégrables, et si À,p € R, alors 
Af + pg est intégrable et on a : 


b 


b b 
f AFO + pg(0))dt = à | farsu | g(t)dt. 


En d'autres termes, l’ensemble E des fonctions intégrables est 
un espace vectoriel, et l'intégrale est une application linéaire 
ER. 


2. (Croissance) Si f et g sont intégrables, et si f < g, alors 


RAE 


Esquisse. Le principe est le même que pour la proposition pré- 
cédente : on vérifie les propriétés pour les fonctions en esca- 
liers d’abord (par exemple le point 2 est donné dans ce cas par 
le lemme 8.4), et on utilise le lemme 8.7 pour montrer par pas- 
sage à la limite que les propriétés sont en fait vérifiées pour des 
fonctions quelconques. 


Sur le même modèle, nous allons conclure en établissant 
la très utile « inégalité triangulaire » pour les intégrales. Nous 
aurons besoin des définitions suivantes : si f est une fonction 
quelconque, on pose 


F= | f(x) si f(x) 20 


0 sinon, 


0 sinon. 


f(x) = | -f(x) si f(x) <0 


On vérifie que l'on a f(x) = f *(x)- f(x) et aussi |f (x)| = f *(x) + 
f7 (x). Aussi, on note que si f < g, alors f* < gt et g7 < f”. 


ProrositioN 8.14 - Si f est intégrable sur [a,b], alors |f| est éga- 
lement intégrable et on a l'inégalité dite triangulaire 


[7 < [ur 


Démonstration. On commence par montrer que f* est inté- 
grable. Puisque f est intégrable, on peut trouver b, et 4, 
comme dans le lemme 8.7. Les fonctions ọ} et Wj, sont en 
escaliers, et on a D; < f* < pi. On vérifie (exercice) que 
VL - Pï < Pn- Pn. Donc finalement 


osf -f < Sin- f on 


(On a utilisé la linéarité de l'intégrale.) En passant à la limite, 
on voit que l'on peut appliquer le lemme 8.7 dans le sens É, 
et on conclut que f* est intégrable. 
De même, on montre que f” est intégrable. Donc |f| = f* + 
f` est intégrable, comme somme de fonctions intégrables. 
Enfin, de f < |f| on tire 


É: < fu 


par croissance de l'intégrale. De même de -f < |f| on tire 


S < [un 


On a bien prouvé l'inégalité triangulaire. 


INTÉGRALES ET FONCTIONS CONTINUES 
[2m] 


Nous allons maintenant montrer le résultat théorique prin- 
cipal du chapitre, à savoir l’intégrabilité des fonctions conti- 
nues. 


THÉORÈME 8.15 — Soit f une fonction continue sur [a,b]. Alors f 
est intégrable. 


Démonstration. On commence comme dans la proposition 8.8. 
Soit n un entier > 1. On va découper [a,b] en n morceaux en 
posant a; = a + j ( 2=4 a), pour 0 < i < n. On définit maintenant 
deux fonctions en escaliers b,, resp. W„, qui sont constantes 
sur chaque intervalle ]a;,a;4,1[ de valeur a;, resp. ß;, avec 


a; = min{f(t)|tefa;,a;,1]} 


et 
Pi = max{f (t) | t € [a;,a;41]). 


(Ceci a un sens d'après le corollaire 5.4, qui garantit que P; + 
+00 par exemple.) Ainsi D, < f < Pn. 

Soit € > 0. Comme f est uniformément continue (d'après le 
théorème de Heine 5.11), il existe ò > O tel que, si x et y sont 
dans [a, b] et vérifient |x-v| < 6, alors |f (x)- f (y)| < e. Mais pour 


n suffisamment grand, on a le < ò; fixons un tel n. Comme 


Aji1 — 4j = be, on voit que si x et y sont pris tous les deux dans 
Ja;,a;,1[, alors |f(x) - f (y)| < £. On en conclut que B; - a; < € 
pour chaque i. 


Ê ë b i 
Si on calcule maintenant f (Pn — n) directement avec la 
formule pour I, on obtient : 


IK (bubu) = Y (area) < (b-a)Ë4 Èt Ë = e(b-a). 


ueu: b ` 
Ainsi, pour tout € > 0, on a 0 < fa (Wn - Pn) < elb — a) dès que n 
est suffisamment grand; c’est dire que 


b 


lim (Wn = Pn) = 


n—+00 


Le lemme 8.7 nous dit alors que f est intégrable. 


On s'aperçoit a posteriori qu'on aurait pu considérer 
d’autres fonctions en escaliers dans cette démonstration, et ob- 
tenir la même limite. Pour être précis, on a le résultat suivant : 


ProPosirioN 8.16 — Soit f une fonction continue sur [a,b]. Pour 
chaque entier n > 1, on pose a; = atifet 1e) pour 0 < i < n, et on 
choisit x; „ € [a;,a;,1]. Alors: 


Démonstration. On reprend les notations de la démonstration 
du théorème 8.15. 

Soit alors 0, la fonction en escaliers, constante sur ]a;,4;:1[, 
de valeur f(x;,). La formule pour I montre que I(6,) est bien 
la somme dont on cherche la limite. 

Par définition, on a alors |@„ < 6, < Pn, et donc 


In) < I(O„) < In). 


Les termes de gauche et de droite de cette inégalité tendent vers 


b , „ ij 
Í. f comme on l'a observé, et donc le terme du milieu converge 
vers la même limite. 


Les sommes de cette forme sont appelées « sommes de Rie- 
mann ». Comme on vient de le voir dans la démonstration, elles 
expriment l'intégrale de certaines fonctions en escaliers qui 
s'approchent de f, et la proposition affirme qu'à la limite on 
obtient l'intégrale de f. Il est clair qu'on aurait pu trouver des 
fonctions en escaliers plus générales pour lesquelles le résultat 
est encore vrai (notamment avec des subdivisions de l'inter- 
valle [a,b] plus compliquées) et c'est parfois sous cette forme 
que l'on énonce un résultat sur les sommes de Riemann dans 
certains livres. D'une manière générale, lorsqu'on étudie cer- 
taines sommes, il faut garder en tête l'idée d'utiliser des fonc- 
tions en escaliers et des intégrales. 

En pratique ceci dit, même la version ci-dessus est trop gé- 
nérale. Dans presque tous les cas que l'on rencontre, le choix 
est x; = 4; ; et très souvent, on a même a = 0 et b = 1. Ainsi, il 
est bon de mémoriser la formule suivante : lorsque f est conti- 
nue sur [0,1], on a 


n-1 


J Y 
> ï) = f roar 


ExEMPLE 8.17 - Soit 


La suite (S„)„>1 a-t-elle une limite? Si on pense à utiliser 
une somme de Riemann, il faut trouver une pore fonc- 
tion f. nes d par faire apparaître le 1 z, puis met- 
tons la quantité + en évidence : 


n-1 n-1 
1 ï` n? 1 1 
Sn n i2+n2 n ) i2 
i=0 io 1 +72 


On a donc bien envie d'introduire la fonction f définie 
sur [0,1] par f(f) = => puisqu'alors : 


Donc S„ est une somme de Riemann, et 


1 1 
dt 
li = t) dt = = sl 
Hn ay f roa R 


Reste à calculer cette intégrale! Nous allons maintenant 
voir comment. 


voir les exercices 
(sans calculer les 
intégrales) 2100 
et 5446 
questions 1, 6, 7 
puis 5, 8 


x 
LA FONCTION X H> f f 


Il existe une hiérarchie des fonctions sur [a,b] : 


f dérivable => f continue => f intégrable. 


On a déjà vu la première implication; la deuxième est le 
contenu du théorème 8.15. On va maintenant montrer qu'en 
intégrant une fonction, on remonte dans la hiérarchie. 

Soit donc f intégrable sur [a,b]. On note 


F(x) = f(t) dt. 


D'après la proposition 8.11, F est bien définie. 


PropositTION 8.18 — Pour toute fonction f intégrable, la fonction F 
est continue. 


Démonstration. Soit donc xg € [a,b]. D'après la relation de 
Chasles, on a : 


FO) -F(xo) = | foar. 


La fonction f est bornée par hypothèse : écrivons |f(t)| < M 
pour t € [a,b]. Utilisons maintenant l'inégalité triangulaire : 


[F(x) — F(xo)l < f If (t)]dt < f Mdt = M(x- xo). 


(On a supposé x > xo, le cas x < xg est similaire.) Ceci montre 
que 
lim F(x) - F(xo) = 0, 


XX) 


c'est-à-dire que F est continue en xo. 


Dans le même genre, on a le résultat annoncé depuis lin- 
troduction de ce chapitre : 


Proposition 8.19 — Si f est continue, F est dérivable. De plus, on 
aR = jf 


Démonstration. Soit xq € [a,b]. En utilisant la relation 


Í f (xo) dt = f(xo)(x = xo) 


et la relation de Chasles, on peut écrire : 


FGF Go) _ = _ 1 


xX- Xp X— Xo 


Í (F) - f(xo))dt. 


Soit € > 0. Comme f est continue en xp, il existe ò > 0 tel que 
|x- xol < ô entraîne |f (x) - f (xo)| < £. Fixons un tel x, et pour 
simplifier disons x > xg. Si maintenant t € [xọ, x], on a aussi 
lt- xol < ô et donc |f (t)— f (xọ)| < £. On en déduit : 


O feos i f O-ro 
1 x 
< = J. eai 
Z E(x — xo) 
` x-=xq 
On a donc bien 
lim RUES. 3 24, 


X—X0 A — Xo 


Donc F est dérivable en xọ, et F/(x0) = f (xo). 


On a donc bien démontré, comme annoncé dans l’introduc- 
tion, que toute fonction continue f admet une primitive, ici 
notée F. Notons que le point délicat était vraiment de montrer 
que f est intégrable : le reste de la preuve ci-dessus n'utilise 
que des propriétés élémentaires de l'intégrale. 

La proposition a une conséquence que l’on appelle, en toute 
simplicité, le «théorème fondamental de l'analyse » : 


THÉORÈME 8.20 — Si f est une fonction continument dérivable 
sur [a, b], alors 


b 
| ft = Fb- flo: 


Démonstration. C'est une reformulation de la proposition pré- 
cédente. Dire que f est continument dérivable signifie que f’ 
est continue, on peut donc appliquer la proposition 8.19 avec 
f ' a la place de f. On en déduit que la fonction définie par 


gtx) =| fat 


est dérivable de dérivée f’. Donc g a la même dérivée que f, et 
ceci entraîne f(x) = g(x) + c pour une constante c. En évaluant 
en a, on obtient f (a) = g(a) + c = c, d'où f(x) = g(x) + f (a). En 
x = b, on obtient f(b)-— f (a) = g(b), ce qu'on voulait. 


ExeMPLE 8.21 - Revenons à l'intégrale rencontrée à la fin 
de l'exemple 8.17: 
1 
f dt _ ? 
o 1+t? 


Pour utiliser le théorème 8.20, il nous faut trouver une 
fonction f telle que 


_ 1 
` 1+t2` 


f(e) 


Passant en revue les dérivées des fonctions que l'on 
connait, on constate que l'on peut prendre 


f (t) = arctan(t) 


(et les autres primitives sur [0,1] sont donc de la forme t H> 
arctan(t) + c). Donc 


1 
dt T 
= arctan(1) - arctan(0) = =. 
Í > arctan(1) - arctan(0) 4 


En particulier, grâce à l'exemple 8.17, on a une formule 
pour calculer x: 


n-1 


tT = lim 4 . 
n=>œ ` L T i2 + n2 


n 


La convergence est très lente. Il faut attendre n =119 pour 
avoir 3 chiffres corrects (3, 149984...) et pour n = 100 000 
on obtient 3,141602..., donc seulement 4 chiffres corrects. 


ExEMPLE 8.22 - On peut retrouver les résultats obtenus « à 
la main » dans les exemples 8.9 et 8.10 très facilement. En 


i EE 2 a 
effet la fonction t H> t admet pour primitive t > $, d’où 


1 t2]! 1 
Fe 


Ici on a utilisé la notation avec les crochets qui vous est 
familière depuis la terminale, à savoir 


LI = fb) - f(a). 


De même on a 


On retrouve bien les mêmes valeurs. 


ExEMPLE 8.23 -La méthode des primitives pour calcu- 
ler les sommes est très puissante ; c’est précisément pour 
cela que les intégrales sont plus faciles à calculer que 
les sommes. Voyons une application. On considère la 
suite (H„)„>1 définie par 


n 


1 1 1 1 

H,=1+=+—-+..+—= Fa 

n 2 3 n > 
J= 


(On appelle parfois (H,) la « série harmonique », d’où la 
notation.) Nous allons montrer que H, tend vers +œ. À 
partir de la définition, c’est difficile. 

Essayons donc d’utiliser des intégrales. Nous n’avons 
pas une somme de Riemann, mais nous pouvons malgré 
tout essayer d'introduire certaines fonctions en escaliers. 
En l'occurrence, considérons l'intervalle [1,n] et la fonc- 
tion en escaliers , qui vaut + sur l'intervalle Ji,i+1[. En 
comptant l'aire des rectangles, on constate que 


n 
| Pn = Hy. 
1 


Soit maintenant f (t) = 1 sur le même intervalle. On a alors 


y > f, ce qui est une conséquence du fait que f est dé- 


croissante. Par suite 
n n 
Í tuz J f 
1 1 


Mais grâce à la méthode des primitives, nous pouvons fa- 
cilement calculer l'intégrale de f : en effet le logarithme In 
vérifie ln’ = f. Ainsi 


" dt 
Í F In(n.) -1n(1) = In(#). 
1 

Or nous savons que In(n) — +œ lorsque n — +œ, donc 
l'inégalité H„ > In(1i) que nous venons d'obtenir garantit 
que H, — +œ. 


reprendre les 
exercices 
précédents et 
calculer les 


intégrales 


LA FORMULE DU CHANGEMENT DE VARIABLES 
o_a 


Une autre conséquence plus ou moins immédiate de la pro- 
position 8.19 est la « formule du changement de variables » qui 
est très pratique dans les calculs : 


PROPOSITION 8.24 — Soit u une fonction continument dérivable 
sur [a,b], et supposons que l’image de [a,b] par u soit l'intervalle 
[u(a),u(b)]. Soit f une fonction continue sur [u(a),u(b)]. Alors : 


b u(b) 
ICONE f fax 
A u(a) 
Démonstration. Pour X € [u(a),u(b)], soit 


x 
F(X) = Í. Td 


et soit g(T) = F(u(T)) pour T € [a,b]. Puisque f est continue, 
la proposition 8.19 permet de calculer la dérivée de F, à savoir 
F' = f ; et la formule pour la dérivée d'une fonction composée 
donne au total : 


D'un autre côté, soit 


T 
HT) =| f (u(t))u'(t)dt 


pour T € [a,b]. L'expression t > f (u(t))u'(t) est bien continue, 
donc la proposition 8.19 (encore) donne h'(T) = f (u(T))u'(T). 
Ainsi, les fonctions g et h ont la même dérivée. Elles sont 
toutes les deux nulles en T = a, donc elles sont finalement 
égales. En écrivant g(b) = h(b), on obtient la formule. 


Pour retenir correctement la formule, nous suggérons un 
petit abus de notation. Dans le membre de droite de la formule 
du changement de variables, l'écriture f(x)dx peut être évi- 
demment remplacée par f(y)dy ou f(z) dz. Si vous pensez que 
l'on peut utiliser n'importe quelle lettre, demandez-vous quand 
même ce que donnerait la formule avec la lettre f ou pire, 
avec d. Nous proposons d'utiliser la lettre u, et donc de mé- 
moriser 


b u(b) 
f f (ut) u'(t) dt -Í ftii: 
a u(a) 


À strictement parler, c'est un abus de notation, puisque la 
lettre u désigne déjà une certaine fonction. Mais l'intuition 
derrière ce choix est assez correcte. Si on lit la formule « de 
la droite vers la gauche », on constate que «en faisant va- 
rier u », donc en remplaçant u par u(t), on doit remplacer du 
par u'(t)dt, ce qui est cohérent avec la notation u'(t) =du/dt 
utilisée en Physique. 

La plupart du temps, on utilise cependant la formule de 
la « gauche vers la droite ». Dans ce sens, on retient que l’ex- 
pression u(t), éventuellement très compliquée, peut être rem- 
placée simplement par u pour peu que l'on ait quelque part 
un u'(t) dt, qui va devenir du. Voici un exemple. 


ExEeMPLE 8.25 — Calculons 


| dt 
o 1+ef` 
On va poser u(t) = e, pour voir. Il nous faudrait un u'(t) dt 


quelque part; or u'(t) = e. On peut donc artificiellement 
écrire 


1 dt _ (! edt fl wu(t)dt _ (* du 
I: 1 +ef -Í et(1+et) -Í u (t)(1+ u(t)) -Í u(1+ u) ` 
On va pouvoir finir ce calcul facilement. Avant de le faire, 
remarquons que si les choses se sont bien passées, c'est 
surtout parce que u'(t) peut s'exprimer facilement en termes 
de u(t). C'est la grande qualité que l'on cherche dans un 
changement de variables. Faites l'expérience suivante : es- 
sayez le changement de variables v(t) = 1/(1 + ef). Vous 
vous rendrez compte que pour faire apparaître le v'(t) dt, 
on est amené à exprimer v'(t) en fonction de v(t). C'est fai- 
sable, mais moins facile que pour u; au total on finit avec 
la même expression, mais après bien plus d'efforts. 

Terminons tout de même. On écrit 


1 1 1 


u(l+u) u l+u 


Vous vérifierez cette égalité sans peine; au chapitre sui- 
vant nous verrons comment systématiser ce genre d’astuce. 
Maintenant il vient : 


e du * du e du 

Las) u Í <= 
= [In(u.)]] - [ln(1 + u)]i 
=1+In(2)-In(1+e). 


- Fin de la première lecture — 


voir les exercices 
812, 2098, 
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chapitre suivant 
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primitives) 


FONCTIONS À VALEURS VECTORIELLES 
EE ————————". 


DÉFINITION 8.26 — Soit f : [a,b] — R" une fonction, et écrivons 


f (t) = (fi (9), .... hE). 


On dit que f est Riemann-intégrable lorsque chaque fonction fy 
est Riemann-intégrable (au sens déjà défini dans ce chapitre). 
De plus, l'intégrale de f est le vecteur 


ae este) 


Par exemple, si nous identifions comme d'habitude l’en- 
semble C des nombres complexes avec R?, en voyant x + iy 
comme (x,y), alors cette définition signifie que nous avons la 
convention suivante : pour une fonction f: [a,b] — C de la 
forme f (t) = x(t)+iy(t), son intégrale est 


[ roa = | x()ar+i | yat. 


C'est évidemment la définition la plus naturelle. 


ProPosirioN 8.27 - On a les propriétés suivantes. 


1. Si f et g sont intégrables, à valeurs dans R', et si À et p sont 
des constantes réelles, alors Af + pg est intégrable et 


b b b 
S OfO tugar f fiatu Í swar 


De plus, si v € R" est un vecteur (constant), et si f : [a,b] > 
R est intégrable, alors la fonction t H> f (t)v est intégrable et 


f rovar = (f roa] v 


2. La relation de Chasles est vérifiée. 
3. Si f : [a,b] — R” est continue, alors elle est intégrable. 


4. Si f : [a,b] => R" est continument dérivable, alors 


b 
[rar = ft fra) 


La démonstration de cette proposition est laissée en exer- 
cice ; c'est une conséquence directe des définitions. Nous allons 
nous contenter de la remarque suivante. Si e, ,..., e, est une base 
de R”, alors pour chaque t on peut écrire 


f(t) =d; (t)ej + => + A,(t)e,. 


En utilisant les deux propriétés énoncées dans le (1) de la pro- 
position, on en déduit, si f est intégrable, que 


b b b 
f fiyae= | Merde+ =+ | À, (fe, dt 
a a - a i 
< ular) f (dre. 


Si maintenant on prend pour e,;,...,e, la base canonique, on 
retrouve la définition même de l'intégrale de f ; en d’autres 
termes, pour que le (1) de la proposition soit vrai, la seule défi- 
nition possible est celle que nous avons donnée. Dans le même 
temps, nous observons que l'intégrale se comporte « comme 
prévu » dans toutes les bases, donc notre définition ne privi- 
légie pas la base canonique. 

Pour travailler avec les fonctions à valeurs vectorielles, il se- 
rait utile de montrer que l’on peut se ramener aux fonctions en 
escaliers, comme dans le cas des fonctions à valeurs dans R. 
La définition de fonction « en escaliers » ne change pas : il 
s’agit toujours d’une fonction $: [a,b] > R” qui est constante 
sur |4x,4g:1[ pour une certaine subdivision (à ceci près que la 
valeur constante est bien sûr un vecteur). 

Il y a une difficulté : écrire |È < f n’a pas de sens pour les 
fonctions à valeurs dans R”. Pour cette raison, on a un résultat 
moins précis que le lemme 8.7, mais qui va suffire. 


ProPosirion 8.28 — Soit f: [a,b] => R” une fonction intégrable. 
Alors il existe une suite de fonctions en escaliers (b,):>0 à valeurs 
dans R' telle que 


b 
f oa f fenar, (1) 
Si de plus f est continue, alors on a 
b 
S o-oo, (2) 
et enfin 
b b 
Í naola f ioar (3) 


Remarquons que l'hypothèse « f continue » est uniquement 
là pour nous simplifier la vie. En effet, pour que les relations 
(2) et (3) aient un sens, il faut que la fonction t H> ||f(#)|] soit 
intégrable, et même la fonction t H> ||f (t) + v|| pour tout vec- 
teur constant v (ainsi en utilisant la relation de Chasles on voit 
que t > ||f (t) - @„(t)ll est également intégrable). Ceci est auto- 
matique lorsque f est continue (cf (3) de la proposition). Dans 
la démonstration vous verrez bien que la continuité n’est pas 
utilisée pour autre chose. 


Démonstration. Pour chaque indice k on applique le lemme 8.7 
à fk, et on trouve une suite (k,n) de fonctions en escaliers telles 


que Pk,n < Sk et 
b b 
Í oeddet Í furar. (s) 


Posons f„(t) = (P1, n(t)---- Pr, (t)). Alors , est en escaliers, à 
valeurs dans R”. La relation (1) est alors une conséquence im- 
médiate des définitions. 

Pour montrer (2), qui est plus difficile à établir, soit e,,..., €, 
la base canonique de R”. Écrivons 


f) - rlt) = (fi (t) - Pi, (t))e1 +> +(f,(t) — Drn(t))er 


D'après l'inégalité triangulaire pour les vecteurs, on a 


IIF (t) DANS LA (E) — Pi, Nes + >>> +166) — Pral) lell. 


Puisque fk > @Èr,„ et Ilekll = 1, on peut réécrire ceci 


If (t) — Pat NS (f (t) -= P1,n(t) + (f,(t) - Prin(t ))» 


` 


d'où 


b b b 
S -oola | far- f gradats 
b b 
f finar- | bent dt 


Ainsi la relation (*) entraîne bien la relation (2). 

Pour la (3), on utilise tout simplement la « deuxième » in- 
égalité triangulaire, celle qui affirme que [|la||—{||b||| < [la — b|| (cf 
lemme 3.31). Ceci donne 


b b 
(If (e) br (ID dt 2 | HAOI- lp (HI dt 


b 
< | IO- par. 


(On a utilisé aussi l'inégalité triangulaire pour les intégrales de 
fonctions réelles.) On constate que (3) est une conséquence de 


(2). 


À l’aide de la proposition 8.28, nous pouvons montrer l’in- 
égalité triangulaire pour les fonctions à valeurs dans R”. Il ne 
vous aura pas échappé qu'il nous a fallu plus d'efforts pour 
l'obtenir que dans le cas des fonctions réelles. 


ProPosirion 8.29 — Soit f : [a,b] — R" continue. Alors 


b 
< | ioar. 


Démonstration. Supposons d’abord que f est en escaliers. Son 
intégrale est alors de la forme 


CT — ak); 


k 


b 
f(t)dt 


où f est constante de valeur ax sur Jap, aķ+ı[. L'inégalité trian- 
gulaire pour les vecteurs donne 


Y (are - ak)ag|| < CT — ap) llall. 


k k 


Or le membre de droite n’est autre que l'intégrale de la fonction 
en escaliers t H> [lf (t)]]. Donc l'inégalité triangulaire est vraie 
pour les intégrales de fonctions en escaliers. 

Pour f continue, on prend une suite (þ„) comme dans la 
proposition 8.28. Pour chaque n on a 


b b 
f du(t)dt < | buts, 


puisque , est en escaliers. Le membre de droite tend vers 
l'intégrale de t + ||f(£)|| d’après le (3) de la proposition. Le 
membre de gauche tend vers 


b 
f(t) dt], 


d'après le (1) de la proposition et le lemme 3.33. En passant à 
la limite sur n, on a donc l'inégalité annoncée. 


Nous allons utiliser ceci pour montrer que « le plus court 
chemin entre deux points, c'est la ligne droite ». 


LONGUEUR D'UNE COURBE 
mm 


Une courbe est tout simplement une application y: [a,b] > 
R”. On utilise surtout le mot « courbe » dans les cas r = 2 
(courbes planaires) ou r = 3 (courbes dans l’espace), mais leur 
étude peut se faire en général. 

Comment définir la longueur d’une courbe y? Une idée na- 
turelle est de chercher une approximation de la courbe par des 
segments de droite, comme dans la figure ci-dessous. 


Plus précisément, on choisit une subdivision ag = a < a, < 
++ < an = b de [a,b], et on considère le segment qui joint y(ax) 
à (4x1), pour O < k < n. La longueur de ce segment est 
Ily(4x+1) — Y(ax)ll, donc une première approximation de la lon- 
gueur de y est 


n-1 
ao ar... an) = Y Yak) Ya). 
k=0 


Si on insère un nouveau point dans la subdivision, disons si 
on ajoute un point aù entre ag et aj , alors on peut écrire 


Iy(a1)— ylao)ll = Ily(a1) - y(ag) + Y(ag) - y(ao)ll 
< |ly(a1) = Y(ag)ll + Iy(ag) - y(ao)ll, 


d'après l'inégalité triangulaire. En conséquence de cette obser- 
vation, on a {(y;40,4ç,41,...,4n) > C( Y; ag, a1,...,an) : la longueur 
augmente à mesure que la subdivision devient plus fine. 


y(a) y(aı) 


y(ao) 
Ceci motive la définition suivante. 


DÉFINITION 8.30 - La longueur de la courbe y: [a,b] > R” est 
€(y) = sup {{(y; (a;)) | (a;) subdivision de [a, b]}. 


On pose £(y) = +œ lorsque le sup n'existe pas dans R. 


On dit parfois d’une courbe y telle que {(y) < +œ qu'elle est 
rectifiable. 

Le résultat qui va rendre les choses calculables est le sui- 
vant : 


ProPosirioN 8.31 — Soit y: [a,b] => R” une courbe continument 
dérivable. Alors 


b 
ty) = || y (oll de. 


Démonstration. Soit a une subdivision. On écrit 


ak+1 
f y (t) dt 
ak 


<| = yældt, (*) 


k 


lly(ak+1)- Y(ag)ll = 


en utilisant le théorème fondamental de l’analyse puis l’inéga- 
lité triangulaire. En faisant la somme sur tous les indices k, par 
la relation de Chasles il vient 


b 
eya) ql yolla, 


et donc r 
e < | Iy ®)lldt. 


Soit maintenant € > 0. On va montrer qu'il existe une subdivi- 
sion a telle que 


b 
f iveda eya) + e, 


ce qui terminera la démonstration. Pour cela, examinons un 
cas simple dans lequel l'inégalité triangulaire est en fait une 
égalité : lorsque v est un vecteur constant, on a bien 


b 
f vdt 


Prenons deux points 44 et 47,1 dans [a,b], et appliquons cette 
dernière remarque avec v = y’(a). Intuitivement, l’idée est 
la suivante : lorsque aj et 4,1 sont très proches, la fonction 
continue y’ ne varie pas beaucoup sur [47,4ar,1], donc elle est 
presque constante, égale à y’(ay); l'inégalité (*) ci-dessus est 
alors presque une égalité. Pour mettre en forme ceci, notons 


b 
= b- ayll= (ba) lvl =| oll dt. 


M; = sup {||y’(#)-y'(ax)ll | t € [ap, akyl} 


et écrivons : 


| " Iy'(o)lldt= Ï ax) + (Y (9)-v'(ar))lldt 


k k 


4k+1 Ak+1 
<| Iv'avlars | Iy) - y'lar)lldt 


k ak 
4k+1 ; Ak+1 , , 
=|] = vavale f ` Iyeo)-vapliar 
ak ak 
Ak+1 j 
< j Y (ap) dell + Mz (ak+1ı — ax) 
ak 


4k+1 
= f [v (t) + (y (ax) - y (e))] dt 
ak 
W (dt 
ak k 
+M}(ax41 — ak) 


<|fy(ar41) — y(ap)l| + 2M; (ak+1 — ak). 


+ Mz (ak+1 — 4k) 


< 


Ak+1 
+ Í ly’ (ax) -v'(s)llde 


Puisque y’ est continue sur l'intervalle compact [a,b], elle est 
uniformément continue d’après le théorème de Heine. Ainsi, il 
existe un ò > 0 tel que {| y’(x) - y’(y)ll < Le) dès que |x- y| < ò. 


On peut alors choisir n un entier tel que b-a < ò, et poser aç = 


a+k(Z2), de sorte que |ap41 — ax] = ba < ò et donc M} < US 


Si on fait la somme des inégalités 


4k+1 A E 
[nat < ta) -a+ È 


k 


pour tous les indices k, on termine avec 


b 
f y (s) < €(y,a) + e, 


comme annoncé. 


COROLLAIRE 8.32 — Soient p et q deux points dans R". Alors la 
longueur minimale d'une courbe joignant p et q est ||q - pll, et ce 
minimum est atteint par la ligne droite. 


Démonstration. Pour montrer que la longueur d'une courbe y 
joignant p à q est toujours supérieure à ||q — pll, il suffit de 
considérer la subdivision ayant seulement deux points ag =p 
et aj = q, puis de s'en rapporter à la définition. 

Prenons maintenant la ligne droite, disons y: [0,1] > R” 
définie par 


y(t)=(1-t)p+tq4 (=p+t(q-p)). 


(C'est bien un déplacement en ligne droite de p vers q.) La dé- 
rivée est Y'(t) = q - p, un vecteur constant, donc 


1 
| Ih (s)lldt =l- pll =e. 


Ainsi dans le cas de la ligne droite le minimum est atteint. 


EXEMPLE 8.33 (CIRCONFÉRENCE D'UN CERCLE) — Considé- 
rons, dans le plan complexe identifié à R?, le cercle de 
centre p et de rayon R. On peut le parcourir avec la 
courbe y: [0,27] — C définie par 


y(t)=p+Re", 


comme expliqué dans le chapitre « L'exponentielle ». Cal- 
culons la longueur de cette courbe, qui est continument 
dérivable. On a y'(t) = Rie" d’où ||y'(t)|| = R. Ainsi 


2T 
€(y) = f Rdt =2mTR. 
0 


La circonférence d'un cercle de rayon R est 2TtR, en particu- 
lier ça ne dépend pas du centre. Evidemment c'était la pre- 
mière définition historique du nombre mt. 


Il peut vous paraitre surprenant qu'une courbe soit définie 
comme une fonction et pas un sous-ensemble de R”, et que la 
longueur d'une courbe y: [a,b] > R” ne soit pas déterminée 
par l’image y([a,b]). Par exemple, dans le cas du cercle, est-ce 
que la longueur change si l'on considère une courbe y qui se 
déplace sur le cercle à une vitesse différente ? Et lorsque nous 
parlions ci-dessus de « la ligne droite » entre p et q, est-ce que 
l'on aurait pu considérer une autre paramétrisation que t H> 
(1-t)p + tq, et trouver une autre longueur ? 

La première réponse à ces questions est que la longueur dé- 
pend en effet en général de la fonction. L'exemple le plus bête 
est celui de la courbe y: [0,47] — R? définie par y(t) = p+Re! : 
en effet cette courbe fait « deux fois le tour » du cercle de 
centre p et de rayon R, et vous pouvez vérifier que sa longueur 
est TR. Alors que l’image y([0,4x]) est le cercle, qui peut être 
parcouru par une courbe de longueur 21tR comme on l’a vu. Ici 
les deux courbes sont très différentes dans leur comportement. 

Cependant, voici un petit résultat qui exprime l’idée que 
des changements simples de paramétrisation ne vont pas chan- 
ger la longueur. 


Lemme 8.34 — Soit yı: [a,b] => R” une courbe continument déri- 
vable, et soit u: [c,d] — [a,b] une bijection, également supposée 
continument dérivable. Soit enfin y2 = y1 o u, qui est encore une 
courbe. Alors 


tyi) = €). 


Démonstration. La fonction u est monotone d’après la proposi- 
tion 4.23, on va supposer qu’elle est croissante (le cas décrois- 
sant est similaire), d'où u(c) = a, u(d) = b, et u’(t) > 0 pour 
tout t € [c,d]. 

On applique alors simplement le théorème du changement 
de variables : 


y) = | Uyg(e)lldt 
= | yiu) u'(e)lldt 


=| lyi uellu (dt 


= | Iyi(w)lldu 


a 


= (y). 


Pour en revenir au cercle, la courbe yı: [0,27] — IR? dé- 
finie par V; (t) = p + Re" et la courbe yz: [0,1] — R? définie 
par y2(t) = p + Re?! sont liées comme ci-dessus, avec u(t) = 
2nt, donc elles ont la même longueur (comme on le vérifie tout 
de suite). 


voir les exercices 
808, 809, 810 
(questions sur 
les longueurs 
seulement; tracer 
les courbes, 
éventuellement à 
l’aide d'un 


ordinateur) 


DÉMONSTRATION DE TAYLOR-YOUNG 
[2 


Nous allons conclure ce chapitre avec la démonstration du 
théorème de Taylor-Young dans sa forme générale (dans le cha- 
pitre sur les formules de Taylor nous avions une petite hypo- 
thèse restrictive). À l’aide des intégrales, c'est très facile. 


Lemme 8.35 — Soit I un intervalle contenant O et f : Ï > R une 
fonction intégrable. On suppose que f(t) = o(f") pour un certain 
entier n. Si on pose 


F(x) = f rar 


pour x € I, alors F(x) = o(x"*!). 


Démonstration. Par hypothèse f (t) = t"h(t) avec h(t) — 0, donc 
si on se donne un e > 0 il existe un ô > 0 tel que |h(t)| < € 
pour |t| < ò. Si on prend également 0 < x < ô on a 


|f roas f iroa 
< L t'edt 


pri x +1 
= =Ë | 
(ET n+1 


On traite de la même façon le cas -ô < x < 0, et finalement on 
constate que si |x| < ò, alors 


F(x) € 
| < 4 
x"+t1|" n+1 
C'est donc que 
F 
CE 
xn+l 


lorsque x — 0, comme on le souhaitait. 


On peut alors montrer facilement 


Démonstration. Par récurrence. Le cas n = 1 est donné par le 
lemme 6.7. Supposons le théorème vrai pour n, et soit f déri- 
vable n+1 fois. Appliquons le résultat au rang n à la fonction f’, 
qui est dérivable n fois : 


’\&) (0 
PO = Po) (pY (O)e+ EEO à oe, 
En intégrant ceci entre 0 et x, et en utilisant le lemme précé- 
dent, on obtient la formule pour f au rang n+1. 


Chapitre 9 


Fractions rationnelles 


Dans ce chapitre, la lettre K désigne Q, R ou C. L'étude des 
fractions rationnelles est un sujet algébrique, mais ce chapitre 
va surtout se concentrer sur l'application au calcul de certaines 
intégrales. Voilà pourquoi nous sommes encore dans la partie 
« Analyse ». 


Le lecteur ayant 
assimilé la 
définition 2.17 
peut prendre 
pour K 
n'importe quel 


corps. 


FRACTIONS RATIONNELLES 
EE Ammar] 


DériniTioN 9.1 - Une fraction rationnelle F à coefficients dans K 
est un quotient de deux polynômes de K[X] : 


F=—, 
Q 


avec Q # 0. L'ensemble des fractions rationnelles est noté K(X). 


Les règles de calcul usuelles s'appliquent. Dans le jargon 
de la définition 2.17, on dira que K(X) est un corps. Des infor- 
mations supplémentaires sont apportées dans l’encadré « Les 
corps de fractions ». 


Le nombre deg P -deg Q est appelé le degré de F, noté deg F. 
Il faut vérifier qu'il est bien défini, puisque la paire (P, Q) n'est 
pas unique : en fait on a 


P P 

QQ 

et ainsi deg P + deg Q' = deg P’ + degQ, d’où deg P - deg Q = 
deg P’ - deg Q’, comme souhaité. 

Notre objectif est de mettre les fractions rationnelles sous 


une forme particulière, qui facilite le calcul des primitives 
lorsque K = R. Tout part de l'observation suivante : 


=> PO'=P'Q, 


LEMME 9.2 - Soit F = Š une fraction rationnelle. Supposons que 
lon ait une factorisation Q = AB avec pgcd(A,B) = 1. Alors il 
existe des polynômes P, et P, tels que 


P, _ P 
P= => dp <$. 

A B 
Démonstration. On utilise le théorème de Bézout (11.22), qui 
nous donne l'existence de U et V tels que AU + BV = 1. Par 


suite 
1 _AU+BV U V 


AB AB TBA 
En multipliant par P, il vient 


P PV PU 


-AB A B’ 


d’où le résultat avec P, = PV et P, = PU. 


On sait donc « couper » une fraction rationnelle en deux 
lorsque son dénominateur se factorise en deux termes premiers 
entre eux. À l'opposé, on a une autre remarque calculatoire : 


Lemme 9.3 — Soient P et Q deux polynômes, soit a un entier, et soit 


P= a É 
Q% 
Alors il existe des polynômes P;, pour 0 < j < a, tels que 
P> P 
Pamp p -%, 
DT D Cr Qa 


et tels que deg P; < deg Q pour j > 1. 


Attention, il n'y a pas de condition sur le degré de Pp. 
Démonstration. Faisons une division euclidienne 
P=AQ+R, 
avec deg R < deg Q. Alors 


P__AQ+R_ A R 
Qc ` Qc = Qc-1 Qa ` 


On peut alors poser Py = R et faire une récurrence sur a. 


On en déduit le théorème principal de ce chapitre. 


Cet énoncé peut paraitre compliqué, mais nous verrons 
qu'il est facile à mettre en pratique. L'essentiel est que chaque 
terme 

j , 
Q; 
que l’on appelle « élément simple », possède une primitive as- 
sez facile à calculer (lorsque K = R). On va donc être capable 
de calculer une primitive de n’importe quelle fraction ration- 
nelle F. 


Démonstration. C'est la combinaison des deux lemmes précé- 
dents. Le deuxième lemme traite le cas n = 1. Dans le cas 
général, on pose À = QÍ! QU'E et B = Q$", de sorte que 
pgcd(A,B) = 1. Le premier lemme donne alors 


P P 
F=—+—, 
A B 


et l'on peut faire une récurrence sur n. 
Reste à montrer le « de plus ». Notons une chose simple : 
si F et G sont deux fractions rationnelles, on a 


deg(F + G) < max(deg F, deg G). 


Dans notre théorème, si deg F < 0, on en déduit que deg Po < 0. 
Or P, est un polynôme, donc ceci impose Py = 0. 


Avant de donner des exemples de calculs, donnons des ver- 
sions de ce théorème spécialisées à R et C. 


CoROLLAIRE 9.5 (ELÉMENTS SIMPLES SUR C) — Soit 


P 
EE (X= x)" +++ (X =X„)% e C(X), 


où les nombres x; sont distincts. Alors on peut écrire 


où PQ est un polynôme et À; ; E C. De plus si deg F < 0 alors Po = 0. exercice: 
montrer que les 
Ài,j sont en fait 


uniques 


EXEMPLE 9.6 — Prenons 


X3-X 
F==—, 
X2+1 


Le premier réflexe est de faire une division euclidienne du 
numérateur par le dénominateur. Ici on a X3 =X = X(X? + 
1) - 2X, de sorte que 


2X 


F=X--LÊ. 
X2+1 


On va maintenant appliquer le théorème au dernier terme 
à droite. Puisque X? +1 = (X —i)(X +i), on sait qu’il existe À 
et p tels que 
2X À u 
X2+1 KA RA 

Le plus simple pour trouver les valeurs de À et p n'est pas 
de procéder comme dans la démonstration du théorème, 
mais simplement d'identifier les numérateurs : 


À u _ (A+p)X+(A-p)i _ 2X 


-+ - = f 
X-i X+i X2+1 X2+1 


On a donc p-À =0 et A+p = 2, donc à = p = 1. Finalement 
1 1 


F=X- - =, 
X-i X+i 


Voici maintenant la version sur R, qui est celle qui nous 
intéresse le plus pour calculer des primitives. 


COROLLAIRE 9.7 (ÉLÉMENTS SIMPLES SUR R) — Soit 
P 


F= e R(X), 
(X =x1)?1 =>>(X - xn) +++ Que 


où les nombres x; sont distincts, chaque polynôme Q; est de degré 2 
sans racine réelle, et pgcd(Q;,Q;) =1 si i + j. Alors on peut écrire 


n ai N 
D 


i=l j= 


j , 
Q; 


m Bi 
i=1 jj 1 


1 


où Po € R[X], et Ai j» pi, j, Yi j € R. De plus si deg F < 0 alors Po = 0. 


ExEMPLE 9.8 - Si on reprend l'exemple précédent, c'est-à- 
dire 

X3_X 

X2+1 
alors on a vu qu'après une simple division euclidienne on 


a 
2X 


X2+1` 
Sur R, on s'arrête là : on ne peut pas factoriser plus le dé- 
nominateur X? +1, et l'expression obtenue est bien de la 
forme annoncée dans le corollaire. Notons d'ailleurs que 
l'on a assez travaillé pour calculer une primitive, en effet 


b x2 
f F(x)dx = + - In(x?+ 1) 


Voyons un exemple beaucoup plus compliqué. Prenons 


F=X 


b 


a 


1 
X5-_2X4+6X3-12X2+9X-18` 


F = 


Il faut d'abord factoriser le dénominateur. Nous avons de 
la chance, puisque 2 est une racine « évidente ». En faisant 
une division euclidienne, on obtient (X — 2)(X4 + 6X? + 9). 
De plus X4 + 6X? +9 = (X? + 3)?, de sorte que 


1 


Le corollaire nous annonce donc que nous pouvons écrire 


X X 
À à MEN , X+Y 


F = ; 
X-2 X2+3 ` (X2+3)2 


(°) 


Il est possible, bien que très long, de mettre le membre de 
droite au même dénominateur. On obtient au numérateur 


(A+ pm)X*+(=2p1 +71) X + (6A + 341 — 271 + Ho) X? 
+(-6p1 +31 -2p2+p)X+(92-6Y -272). (*) 


En écrivant que ce numérateur doit valoir 1, on obtient 
alors un système à 5 inconnues et 5 équations, dont on sait 
qu'il possède des solutions, et on peut les trouver par les 
techniques habituelles. À l’aide d’un ordinateur, c’est une 
méthode très efficace. 

Bien sûr pour finir le calcul « à la main », on peut uti- 
liser des astuces. Voici une compilation des plus connues. 
Multiplions l'équation (*) par le polynôme X -2 : 

1 (pX +y1)(X-2) (2X + y2)(X - 2) 


= À+ 


Ll 7 2 X2+3 (X? +3)? 


On peut voir ça comme une égalité de fonctions, et on va 
regarder la valeur en X = 2 : il reste simplement À = 5- On 
a déjà trouvé À! 

Maintenant multiplions (*) par (X?+3)? ; nous obtenons 


1 1 (X? +3)? 


_1 1 (X+3) 4 
X-2 49 X-2 + (p1 X +Y1)(X<+3)+(p2X+ %2). 


On évalue en X = iV3 (pour que X? +3 = 0), et il reste 


simplement 
1 


iV3-2 
Pour trouver les parties réelle et imaginaire du membre de 
gauche on écrit bien sûr 


1  _-2-iv3 
iV3-2 7 
DS 2 1 
d'où y2 =-f$ et p? =-7. 
Ensuite, on peut choisir d'évaluer (*) en X = 0, parce 
que c'est relativement facile : on obtient 


=p2iV3+72. 


1 d 37 
18 ` 3 Ï!” 882’ 


DS RA 2 
d'où y =-%- , | 
Regardons le numérateur (**) ci-dessus. Il commence 
par le terme (\+u)X#, ce que l’on peut vérifier de tête 
très vite sans tout mettre au même dénominateur. On a 
ja 1 
donc À+ pı =0 d'où p =-= -5 
Finalement 


1 1 X+2 7X+14 


F= = = | 
49\X-2 X2+3 (X2+3) 


Ce calcul était relativement compliqué. Pourrait-on confier 
une partie de la tâche à un ordinateur? La seule chose qui 
n'était pas purement mécanique dans le raisonnement ci- 
dessus était... de trouver que 2 était une racine du dénomina- 
teur. Ceci étant, un ordinateur peut (au pire) mettre les deux 
membres de (*) au même dénominateur et résoudre un sys- 
tème, et ce, en une fraction de seconde. Retenons : 


ProposirioN 9.9 — Lorsque l'on sait factoriser complètement le dé- 
nominateur d’une fraction rationnelle, trouver la décomposition en 
éléments simples est une procédure automatisable, que l’on peut 
confier à une machine. 


Par contre, vous aurez peut-être besoin de savoir décompo- 
ser une fraction à la main, pour les besoins d’un concours ou 
d’un examen ! Dans l’absolu, il est utile de savoir traiter les cas 
très simples, mais il est absurde de devenir expert. 


voir l'exercice 
824 (les 
décompositions 


seulement) 


INTÉGRATION DES ÉLÉMENTS SIMPLES 
[D=] 


Nous fixons désormais K = R. La décomposition en élé- 
ments simples est censée nous aider à calculer les primitives, 
et pour mettre cela en oeuvre il faut savoir intégrer chacun des 
termes apparaissant dans le corollaire 9.7. 

Les plus simples sont bien sûr 


L dx = _ (x x0) ®t] 
l (x—xp)® | -a+1 ò 


4 dx 
f =[1n|x- xol ]} 
p 


pour a> 1 et 


X — Xp 


(ne pas oublier la valeur absolue). Il nous reste donc à traiter 


14. Ax+y 
— dx. 
J, (ax2+bx+c)% x 


Il y a toute une série d'étapes pour y arriver. Le premier 
réflexe est de « faire apparaître la dérivée du dénominateur au 
numérateur ». En effet on sait calculer 


ih 2ax + b de= (ax? + bx + ct À 
p (ax? + bx + c)* a+1 p 


pour a> 1 et 


1 2 b 
| 52 dx= | Inja? +bx+e |f. 
p ax*+bx+c p 


Donc on va se débrouiller pour faire apparaître 2ax + b. 


ExEMPLE 9.10 - À la fin de l'exemple 9.8 nous avions le 
terme 


x+2 
x2+3 ` 
On écrit alors 
x+2 | 2x * 4 ) 
x2+3 2\x2+3 x2+3/ 


de sorte que l’on sait intégrer une partie au moins de l'ex- 
pression : 


q 2 1 (1 2 1 1 
f = dx = | — dx+2 | 7 dx 
p x +3 2 p x +3 p x +3 


1 q 1 dx 
== |In(x? 2 : 
> [na +3)] + | 2.27 


De la même manière si nous avons à intégrer l'expres- 
sion 
5x—3 


x2+x+1” 
la première chose à faire est d’écrire 


5x—3 => 2x+1 11 
x2+x+1 2\x2?+x+1/ 2(x2+x+1) 


On a alors 


1 5x3 5 11 {f d 
f dx = 3| In? +41) f f 3 xX 
p x +x+1 2 p 2 p x +x+1 


Retournons au cas général. Nous sommes ramenés à calcu- 
ler les intégrales de la forme 


f dx 
p (ax? +bx+c)"’ 


avec b? — 4ac < 0 puisqu’on suppose que le dénominateur ne 
s’annule pas. On en connaît une : 


1 dx 
f ii [ arctan(x) lÉ ; 
p 


Nous allons voir que l’on peut toujours se ramener à ce cas-là 
(ce qui explique la présence abondante de la fonction arctan- 
gente dans toutes les questions de primitives). La prochaine 
étape est de faire un changement de variables pour mettre le 
dénominateur sous la forme u(x)? +1. 


ExEMPLE 9.11 — Reprenons les exemples ci-dessus. On a 


l doo 1 -i 
x2+3 3(%Ż41) _ 3((F)?+1) ` 3(u(x)2+1) 
avec u(x) = T On a u'(x) = T et donc 


j dx á Js àx E h u'(x)dx 
p x2+3 3 p u(x)? +1 3 p U(x)?+1 
_ V3 q/V3 du V3 TA 


= [arct 
3 J,/V5 u2+1 3 [aretan p 


Plutôt que de refaire ce changement de variables à 
chaque fois, on peut décider de mémoriser qu’une primi- 
tive de x H> ar est x H> larctan(%) (tout dépend de la 
quantité de primitives que l'on souhaite garder en tête). 


Pour a = V3 on retrouve le résultat ci-dessus évidemment 


_ V3 


(noter que Ts = 35 ). Cependant, il est parfois préférable 


de refaire le changement de variables, notamment lorsque 
le dénominateur est élevé à une puissance (voir plus bas). 

Essayons maintenant x?+x+1 au dénominateur. La pré- 
sence du terme de degré 1 nous force à une étape prélimi- 
naire : 


lV 1 3 
2 2 

x*+x+1=[x+=] ==>+1=&t(x)*+ = 
( | 4 (=) 4 


avec t(x) = x + $. On peut faire un premier changement de 
variables : 


1 
f dx =| t'(x)dx | dt 
7 — S PETE = Er . 
p X +x+1 Jp t(x)?+3 Jp +3 
Ou bien on change encore de variables, ou bien on utilise 
la primitive que l'on connait, pour en arriver à : 


fe < | j | < in 
— =| —arctan| — . 
pri +3 [V3 V3/1p+3 


w 


En utilisant ce genre de changements de variables, on en 
arrive finalement toujours à calculer une intégrale de la forme 


| =| dx 
"> J, (x2+1)" 


Nous savons faire pour n = 1, et la dernière chose que nous 
devons apprendre est le calcul de I, pour tout entier n. 

C'est le moment d'utiliser la technique, que vous avez vue 
au lycée, de l'intégration par parties. Le principe est très simple : 


de la formule 
(fg) =Fe+fg, 
on tire f'g =(fg)' - f g' et donc 


q q 
f E E = [Fe -f Flag (s) dx, 
p p 


(Cette formule est valable dès que f et g sont continument dé- 
rivables.) 


ExEMPLE 9.12 — Pour trouver une primitive de x H> ln(x), on 
peut faire une intégration par parties avec f(x) = x et g(x) = 
ln(x), d’où 


E In(x) dx = | xin(x) 12 - j dx 
p 


p 
= [xIn(x) - x]g à 


Une primitive est donc x > xln(x) -x. 


Pour en revenir au calcul de I„, on a la formule de récur- 
rence suivante. 


Lemme 9.13-Pourn>1 ona 


I -2l Z 1 x n 
PT ons CDan 


Plutôt que d'apprendre cette relation par coeur, il vaut 
mieux retenir que la démonstration, que voici, s'appuie sur une 
intégration par parties. 

Démonstration. On prend f(x) = 1 et g(x) = d’où 


1 
x2+1)77 


i x 1 a jk x?dx 
=| n -_ o 
n (x2 + 1)” » 9 (x2 + 1 )n+1 


En écrivant x? = x? +1 —1, on constate que la dernière intégrale 
à droite est I„ -1I,,1. On en tire le résultat en arrangeant les 
termes. 


ExEMPLE 9.14 - Pour calculer 


f dx 
p (2243) 


on commence par poser u(x) = Ts comme dans l'exemple 
précédent, de sorte que 


I dx -Ef du 
p (x2+3)2 9 Jy (u2+1)2 


avec p’ = £- et g = -L. On fait une intégration par parties : 


V3 V3° 
1 du u (r T u2+1-1 
f l +2 | 5.12 du 
p u*+1 1u2+1 lp p (u4+1) 


q ï d 
= | a + 2arctan(u)| -2 E 
u? +1 p p (u?+1)? 


|n ” sd | ” taranto]! 
2 2 2 2 ` 
p' (u2+1) 2|(u?+1) j 


Finalement 


i 2 _ 3 ks + arctan(a) |" 
p (x2+3)2 ` 18 [u2+1 p/vV3 ` 


Ces calculs sont difficiles. Cependant, nous pouvons à nou- 
veau remarquer que rien n'empêche un ordinateur de les faire 
pour nous : toutes les étapes sont parfaitement mécaniques. 


PropPosirioN 9.15 — Lorsque l'on sait factoriser complètement le 
dénominateur d'une fraction rationnelle, trouver une primitive est 
une procédure automatisable, que l'on peut confier à une machine. 


Là encore, renseignez-vous pour savoir si l'on attend de 
vous, à l'occasion d'un concours ou d'un examen, que vous 
sachiez calculer ces primitives « à la main ». C'est très pro- 
bable! En tout cas il est souhaitable de savoir traiter quelques 
exemples. 


voir l'exercice 
824 


FRACTIONS RATIONNELLES TRIGONOMÉTRIQUES 


Nous allons apprendre à calculer des intégrales d’un certain 
type précis, à savoir de la forme 


Í Ftcos(0sin(o) ao. 
P 


Ici on suppose que l'on a une fonction (x,y) => F(x,y), à deux 
variables, définie au moins aux points (x,y) = (cos(0),sin(0)) 
pour p < O < q. L'ensemble de ces points est un arc de cercle, et 
en faisant un peu de géométrie nous allons trouver un chan- 
gement de variables judicieux. En particulier, l'intégrale ci- 
dessus va se ramener à une intégrale de fraction rationnelle 
lorsque F(x,y) est une expression utilisant seulement des opé- 
rations arithmétiques (addition, soustraction, multiplication et 
division), disons par exemple 


253 = 
F(cos(9), sin(9)) = a ao i 


On dit parfois alors que F(cos(8),sin(@)) est une « fraction ra- 
tionnelle trigonométrique ». 

Pour les impatients, il est très simple de résumer la mé- 
thode : utiliser le changement de variables t(0) = tan($). Vous 
pouvez de suite aller voir l'exemple 9.17 ci-dessous, en prenant 
connaissance des équations (**) au passage. Mais il est instruc- 
tif de prendre le temps de comprendre pourquoi cette astuce 
fonctionne. 

Considérons le dessin ci-dessous. On identifie le plan R? 
avec C, et sur le dessin on a placé le point z9 = —1 ainsi qu’un 
point z = x + iy = cos(0) +isin(@) sur le cercle unité. 


L'idée très simple est la suivante : au lieu de repérer le 
point z à l’aide de l'angle 6 qu'il fait avec l’horizontale de- 
puis l’origine, on peut utiliser l'angle œ, entre l'horizontale et 
la droite passant par zo et z. Remarquons que le triangle repré- 
senté sur le dessin est isocèle, donc possède deux angles égaux, 
et 2a+ B =T ; mais 0 + P = x donc œ = 9, 

On peut retrouver ceci par le calcul. Écrivons z = x + iy, 
alors le vecteur u = Z — zo est simplement u =z +1 =x+1+iy. 
Par définition de a, on a aussi u = re!* = rcos(a)+risin(a) pour 


un certain r > 0, donc tan(a) = A Puisque z est de module 1, 


on peut également écrire x = cos(0) et y = sin(8), de sorte que 
"E sin(0) _ 2 cos(2)sin(2) e i =tan(2). 
cos(0)+1  2cos(2)2-1+1 cos($) 2 


On retrouve bien œ = 
et a dans ] - 3, 5. 
Nous venons d'utiliser quelques formules de trigonométrie 
bien connues. C'est en faisant un petit effort de calcul supplé- 
mentaire que l'on va comprendre l'intérêt d'utiliser a au lieu 


de 6. Posons t = tan(2) = L> et calculons 


2, si l'on prend 6 dans l'intervalle ]-n, "| 


jpa tr ttl 2 
= (x+1)2 xl’ 


uisque x? +y? = 1. On en tire 
puisq y 


2 * 
X+ 2 (*) 
d’où 3 
1-t 2f 
x=cos(0)=-= > et y= sin(0)= —. (**) 


` 1+t2 

(La deuxième en multipliant (*) par t, puisque y = t(x+1).) Ces 
relations sont très intéressantes, puisqu'elles nous poussent à 
utiliser en réalité t, et non pas œa lui-même, pour repérer le 
point z sur le cercle : l'avantage est alors que les coordonnées x 
et y de z sont des fractions rationnelles en t. Par contraste, 
lorsque l’on exprime x et y en fonction de 6, on fait appel aux 
fonctions cosinus et sinus, qui sont bien plus compliquées (la 
différence va devenir très claire dans le calcul des primitives, 
ci-dessous). 

Pour résumer, nous avons montré la chose suivante. 


ProposirioN 9.16 - Soit z = x + iy un nombre complexe; on sup- 
pose z + -1. Alors z est de module 1 si et seulement s’il existe un 
nombre réel t tel que 


Dans ce cas, on a 


donc en particulier t est uniquement déterminé par z. 


Ce résultat n'est pas seulement intéressant pour les pri- 
mitives (voir l’encadré « Triplets pythagoriciens »). Mais pour 
l'instant, faisons donc le lien avec le calcul des intégrales, dont 
nous nous sommes écartés temporairement. Rappelons que 
nous cherchons à calculer 


Í ` Ficos(0),sin(0))d0, 
p 


La petite étude géométrique ci-dessus nous pousse à introduire 
le nombre t, qui a l'air de donner des formules simples. Plus 
précisément, posons 


t(0) = tan(3). 


Est-ce un bon changement de variables ? Tout d'abord, d'après 
(**) nous avons 


F(cos(0),sin(0)) = r ( 1O 2t(8) | 


1+1+(0)2°1++(0)2 
Quant à la dérivée t'(0), nous sommes chanceux car elle vaut 
P 1 0\V\ 1 2 


On peut donc toujours écrire 


q (FAD. 2t(0) | t'(0) 


q 
J, F(cos(0), sin(0)) dO = al Fl] +t(0)2’ 1+ t(0)2] 1+ t(0)2 


Ha) [1-82 2t \ dt 
=2 F 2’ 2 2 
t(p) 1+t4 1+t-4/ 1+ft 
Lorsque F est une fraction rationnelle trigonométrique, l'ex- 


pression que nous avons à intégrer est une fraction rationnelle 
en t. Nous savons donc comment en trouver une primitive. 


de 


ExEMPLE 9.17 - Essayons de calculer 


_ z cos(0)d0 
ï= Í cos(0) + sin(0) ` 


Nous avons bien une expression en cos(@) et sin(0). 
Comme nous l’avons dit, la seule chose à retenir est que po- 
ser t(0) = tan($) est une bonne idée. Écrivons t pour t(0), 


et remplaçons cos(8) par o: puis sin(0) par H>. Il vient 


cos(6) 1-t2 = _ L(1-#2)(1+ #2) 


cos(0)+sin(0) ` -t2+2t+1  4(-t2+2t+1)(1+t?) 


La deuxième manoeuvre est là pour faire apparaître }(1 + 
t?) = (6). On a donc 


= 1 (1-#2)dt 
= Jo (=t2+2t+1)(1+12)' 
le t'(9) dO devenant dt. Nous avons donc une fraction ra- 
tionnelle en f. 
Le facteur -#?+2#+1 au dénominateur s'annule pour t = 


1 + V2, ce qui permet de factoriser. La décomposition en 
éléments simples s'écrit alors 


1-1? 1 1 
-(1-1-V2Xt-14V2)1182) 4(t-1-V2) 4(1-14Vd) 
t-1 
ALFE) 


D'où la primitive 
1 1 1 a „d 
amlt- 1-V2| + grl- 1 + V2|- gri +t^)+ „ arctan(t). 


Cette expression vaut 0 pour t = 0 (noter que In(V2 -1)+ 
In(V2 +1) =1In( V2” —1) = In(1) = 0), et elle vaut Z pour t = 


1. Finalement I = Ï. 
voir les exercices 


2095, 2090 


Chapitre 10 


Équations 
différentielles lineaires 


Une équation différentielle est une équation dans laquelle 
l’inconnue est une fonction, souvent notée y dans ce chapitre. 
Par exemple, si f est une fonction quelconque, on peut consi- 
dérer l'équation différentielle très simple 


y =f, 


dont les solutions sont les primitives de f. Nous avons étu- 
dié cette équation dans le chapitre sur les intégrales. Autre 
exemple : l'équation 
VE 

a pour solutions (définies sur R) les fonctions de la forme y(x) = 
ce* avec c E R, et aucune autre. Ceux qui ont lu l'appendice B 
ont vu ce résultat à l'occasion du lemme B.4, et nous allons le 
redémontrer sous peu. 

Dans ce chapitre, nous donnons un certain nombre de re- 
cettes pour résoudre des équations bien particulières, qui sont 
parmi celles que l'on rencontre le plus souvent. Nous aurons 
besoin du calcul de primitives, et aussi de l'algèbre linéaire 
pour les équations les plus compliquées. L'an prochain vous 
verrez quelques résultats généraux, notamment sur l'existence 
et l'unicité des solutions. Cette théorie générale n'est pas né- 
cessaire pour l'instant. 


EQUATIONS LINÉAIRES D'ORDRE 1 
PT 


Ce sont les équations de la forme 


y (x) = a(x)y(x) + b(x). (E) 


L'équation homogène associée est 


y (x) = a(x)y(x). (H) 


En général on a une restriction à x € I, oà I C R est souvent un 
intervalle (voir les exemples ci-dessous). 
La proposition suivante justifie l'adjectif « linéaire » : 


ProposirioN 10.1 - L'ensemble Sy des solutions de l'équation ho- 
mogène est un espace vectoriel. 

De plus, si yo est une solution particulière de l'équation (E), 
alors n'importe quelle solution y, de (E) peut s'écrire 


Di = 6 =r 


où y est solution de (H). Réciproquement si yı est de cette forme, 
alors y, est solution de (E). 


Notons une chose : on peut considérer les solutions y à va- 
leurs dans R, ou bien celles à valeurs dans C. L'espace vecto- 
riel Sy est lui-même réel ou complexe selon le choix que l’on 
fait. La théorie est la même dans les deux cas (alors que dans la 
suite du chapitre, vous serez peut-être surpris de voir que l’on 
travaille avec C en général). 


Démonstration. Si y et z sont des solutions de (H) alors on cal- 
cule tout simplement 


(+z) =v +z'=ay+az=a(y+z), 


donc y + z € Sy. On vérifie également facilement que si y E€ SH 
et si À est un scalaire, alors Ày € SH. Donc Sy est un espace 
vectoriel. (En langage plus savant : l'application y H> y’ - ay est 
linéaire, et Sy est son noyau.) 

Pour la deuxième partie, soient yg et yı deux solutions de 
(E), alors 


(yı - Yo) = y1 - Yo = (ayı +b) - (ayo + b) = a(yı — yo), 


donc la fonction y = yı - y, est bien solution de (H). Un calcul 
similaire établit la réciproque. 


Nous connaissons donc la structure de l'ensemble des solu- 
tions de (E), et l'on est poussé à commencer par résoudre (H). 
C'est assez facile. 

Voyons d'abord l'idée intuitive (qui va aussi servir 
de moyen mnémotechnique). On souhaite résoudre l'équa- 
tion y' = ay. On a bien envie d'écrire 

"=a, © 


y 


mais alors il faut se restreindre aux fonctions y qui ne s'an- 
nulent pas. Ceci étant, on peut intégrer les deux membres de 
l'équation (*), pour peu que a soit continue. Il vient 


x 2 d X 
f n É = [n ly), =| a(t)dt. 


Ici nous avons supposé que y était définie sur un intervalle I 
contenant x, et x. On va réécrire un peu cette égalité. Posons 


de sorte que l'on a 
In|y(x)] = a(x) + co, 


où co est une constante. Il vient 


Débarrassons-nous de cette valeur absolue. On a supposé que y 
ne s’annulait pas, et était définie sur un intervalle; de plus, 
on suppose dès le départ que y est dérivable donc continue. 
D'après le théorème des valeurs intermédiaires, y ne change 
pas de signe. On a donc ou bien y(x) = |y(x)| pour tout x € I, ou 
bien y(x) = -|y(x)| pour tout x. En posant c = +e®, on en conclut 
que 

p(x) = ce", (**) 


pour une certaine constante c, et pour tout x e I. 

Nous avons donc montré que les solutions de (H) qui ne 
s'annulent pas sur un intervalle Ï sont de la forme (**). On ima- 
gine assez difficilement comment une solution pourrait s'an- 
nuler, et prendre la forme (**) là oà elle ne s'annule pas. C'est 
en effet impossible, comme le montre le résultat suivant. 


ProPosiTION 10.2 — Supposons que a est continue sur un inter- 
valle I, et que y est une solution définie sur I de l'équation 


y (x)=a(x)y(x) (xen. 


où a est une primitive de a, c'est-à-dire que œ’ = a. Réciproquement 
pour tout c cette expression donne une solution. 


Notez que maintenant que nous avons pressenti ce résultat, 
nous en donnons une démonstration complètement détournée 
(et très efficace). 


Démonstration. Soit a une telle primitive, qui existe puisque a 
est continue. Considérons la fonction f définie sur I par f(x) = 
y(x)e-&(*). Alors 


f (x) = ve à (x)y(x)e * = (a(x)p(x)-a(x)y(x)) e = 0. 


Donc la fonction f est constante sur l'intervalle I, disons f(x) = 
c. D'où le résultat (la réciproque est évidente). 


En particulier, la seule solution qui s'annule est obtenue en 
prenant c = 0, et alors y est la fonction nulle. 


ExEMPLE 10.3 — Si on revient à l'équation y’ = y sur I = 
R, la proposition nous dit que ses solutions sont de la 
forme y(x) = ce*, comme on le savait. 


ExeMPLE 10.4 — Considérons maintenant y’(x) = xy(x), 
sur I = R. Pour se rappeler l'énoncé de la proposition, il 
est très courant de refaire les premières étapes du calcul 
que nous avons fait en préliminaire. On écrit donc 


P =>. 
y(x) 
d'où 
y2 
Inly(x)| = > + constante, 
puis 


ya 


y(x) = ceT . 


(On retient que « la valeur absolue est passée dans c ».) 


TROUVER UNE SOLUTION PARTICULIÈRE 
LE 


Nous savons désormais résoudre (H). Pour résoudre (E), 
reste à trouver une solution de (E), et à appliquer la propo- 
sition 10.1. À cette fin, il existe un principe général, qui ser- 
vira dans tout le chapitre (et mérite d’être tenté avec mim- 
porte quelle équation différentielle). Cette méthode porte le 
nom troublant de variation des constantes. 

Le principe est le suivant. Après avoir trouvé les solutions 
de l’équation homogène, on constate qu’elles s'écrivent avec 
un certain nombre de paramètres (les « constantes »). On peut 
alors essayer de trouver une solution de l'équation générale en 
remplaçant ces paramètres par des fonctions (donc en les fai- 
sant « varier »). 

C'est une recette assez vague, qui s'applique dans de nom- 
breuses situations. Dans le cas des équations linéaires d'ordre 
1, les choses sont très simples. Les solutions de (H) sont de la 
forme y(x) = ce“). Pour trouver une solution de (E), on peut 
alors essayer une fonction de la forme y(x) = c(x)e**). 


ExEMPLE 10.5 - Cherchons une fonction y telle que 


y (x) =y(x) +1. (E) 


On a vu que les solutions de v'(x) = y(x) sont de la 
forme y(x) = ce*; d'après le principe de variation de la 
constante, on a intérêt à chercher une solution sous la 
forme y(x) = c(x)e*. 

On a alors y'(x) = c'(x)e*+c(x)e* = (c'(x)+c(x))e*. Si nous 
remplaçons y’ par sa valeur dans (E), on trouve 


(c'(x) + c(x))e* =c(x)e*+1, 


ce qui revient à c'(x)e* = 1 ou encore c'(x) = e*. On en 
déduit c(x) = -e *+ constante; comme on cherche juste 
une solution (et non pas toutes les solutions), on prend 
la constante égale à 0. Finalement c(x) = -e"*, et y(x) = 
-e *e* = -1. La fonction constante égale à -1 est solution 
de (E), comme on aurait pu le remarquer tout de suite! 
Pour finir le travail, appliquons la proposition 10.1. 
Elle affirme que la « solution générale » de (E) (selon l'ex- 
pression consacrée) est de la forme -1 + ce*, avec cE R. 


Dans le cas qui nous préoccupe des équations linéaires 
d'ordre 1, on a en fait le résultat suivant. 


Lemme 10.6 — Pour les équations linéaires d'ordre 1, la méthode de 
la variation de la constante fonctionne toujours, et se ramène à un 
calcul de primitive. 


C'est pourquoi vous entendrez les gens parler « d'intégrer » 
une équation différentielle, au lieu de la « résoudre ». 


Démonstration. Les solutions de y’ = ay, lorsque a est continue, 
sont de la forme y(x) = ce“), où a/(x) = a(x). Cherchons une 
solution de l'équation y’ = ay + b sous la forme y(x) = c(x)e%*). 

On a y' (x) = (c'(x) +a(x)c(x))e* = a(x)y(x) + c'(x)e*(). Donc 
l'équation y’ = ay+b revient à c'(x)e^() = b(x), ou encore c'(x) = 
b(x)e-*(*). On s'est donc bien ramené à calculer une primitive 
de b(x)e- t, 


ExEmMPLE 10.7 - Prenons l'équation 


7 (x) arctan 
pe ren, (E) 


Commençons par l'équation homogène 


| x 

y (x) = a 9 (H) 
qui donne 

y (x) _ _1 

y(x) = 1+x2” 
d'où 

Inly(x)|=arctan(x)+c, 
et 
y(x) 5 cerctan(x) : 


Maintenant, cherchons une solution particulière de (E), 
sous la forme y(x) = c(x)e@ïctan()., On peut faire un calcul 
direct de y’ et remplacer dans (E); on peut aussi si l’on 
préfère retenir la formule obtenue dans la démonstration 
du lemme; enfin on peut aussi redémontrer rapidement 
le lemme, lorsque le cas général est plus clair que le cas 
particulier considéré (dériver c(x)e@ïctan(x) n’est pas telle- 
ment plus agréable que dériver c(x)e*®)). Bref, on constate 
que y(x) = c(x)earctan(*) est solution de (E) lorsque 


c'(x) — earctan(x) ,—arctan(x) =T. 


On prend donc c(x) = x, et alors y(x) = xe@rctan(). On peut 
vérifier rapidement que c'est bien une solution de (E). 
La solution générale de (E) est alors 


arctan(x) 


arctan(x) + ce 
ë 


y(x) = xe 


où cest une constante. 


voir l'exercice 
4054 


EQUATIONS LINÉAIRES D'ORDRE SUPÉRIEUR 


Sans se restreindre à l’ordre 1, une équation différentielle li- 
néaire est par définition de la forme 


y" D(x) = an(x)y (x) + + ao(x)(x) + bx). (B) 
L'équation homogène associée, sans surprise, est 


pl D (x) _ an(x)y (x) + + ap(x)y (x). (H) 


La structure générale des solutions ne change pas : 


Lemme 10.8 — La proposition 10.1 est valable pour les équations 
d'ordre supérieur. 


Démonstration. Si y est une fonction dérivable (n + 1) fois sur 
un ensemble I, alors on note D(y) la fonction 


D(y) — mure e ay) —:--— A09; 


alors D(y) est encore une fonction définie sur I. On vérifie tout 
de suite que D(y + z) = D(y) + D(z) et D(Ay) = AD(y) si À est 
une constante. Comme Sy est l’ensemble des fonctions y telles 
que D(y) = 0, on voit de suite que c’est un espace vectoriel. 

En d’autres termes, on peut voir D comme une applica- 
tion E — F où E est l’espace vectoriel des fonctions dérivables 
(n+1) fois sur I, et F est l’espace vectoriel de toutes Les fonctions 
sur I; alors Sy = ker(D), c'est donc un espace vectoriel. 

Le reste de la proposition 10.1 se démontre dans ce cas plus 
général mutatis mutandis. 


Nous avons vu comment résoudre les équations d'ordre 1 
dans le début du chapitre. Il y a un autre cas particulier que 
l’on sait traiter : celui des équations « à coefficients constants », 
c'est-à-dire de la forme 


pl (x) E ay (x) +--+ agy(x) + b(x), (E) 


l’équation homogène associée étant 
y" D(x) = any (x) + -+ + aoy(x). (H) 


On commence par une remarque simple : il est facile de 
trouver des solutions de la forme y(x) = e*, En effet dans ce cas 
on a y'(x) = Xe^*, puis y”(x) = \'e/*, et on voit immédiatement 
que y% (x) = X e^* pour tout k > 0. Si nous insérons ceci dans 
l’équation (H), on obtient 


uH = [a A" ++ aA taole, 


ce qui revient en simplifiant l’exponentielle à x(À) = 0, en po- 
sant 
K(X) =X T2 [a X" ++ a X + a0]. 


On appelle x(X) le polynôme caractéristique de l'équation (H). 

Puisque Sy est un espace vectoriel, on peut obtenir d’autres 
solutions en considérant des combinaisons linéaires, c'est-à- 
dire des fonctions de la forme 


Àx Amx 
z 


y(x) = cje" 4 +04 Cyl 


où À1,...,1 sont des racines du polynôme caractéristique. 
Nous allons maintenant montrer que, sous l’hypothèse que ce 
polynôme admet n+ 1 racines distinctes, il n’y a pas d’autres 
solutions : 


ProPosirioN 10.9 — Supposons que le polynôme caractéristique x 
admette n +1 racines distinctes À, M,..., Àn dans C. Alors toute 
solution y à valeurs complexes de l'équation homogène, définie sur 
un intervalle, est de la forme 


Xx Àn x 


y(x) = coe" + ...+c„e^r*, 


où ck € C. En particulier une telle solution peut s'étendre en une 
fonction définie sur R tout entier. 


Avant de donner la démonstration, voyons tout de suite 
quelques exemples simples. 


ExEMPLE 10.10 - Considérons l'équation homogène 


y =y. 


Le polynôme caractéristique est x(X) = X? -1=(X-1)(X+ 
1). La solution générale est donc 


y(x) = ce +oe ^. 


ExEMPLE 10.11 — Voyons maintenant 


” 


y = y: 
Cette fois le polynôme caractéristique est x(X) = X? +1 = 
(X + i)(X -i). La solution générale est donc 
y(x) = c1e™ + cze "*. © 


Mais cette fois-ci, on peut se demander quelle forme parti- 
culière est prise par les solutions à valeurs dans R. Écri- 
vons simplement que y(x) € R si et seulement si y(x) = 
Re(y(x)). En prenant la partie réelle de (*), on constate 
alors que y(x) est de la forme 


y(x) = acos(x) + bsin(x), (**) 


où a et b sont des constantes réelles. (Si vous faites le calcul 
vous verrez que l'on a précisément 


a =Re(c1) + Rec») et b=Im(c>)-Im(ci), 


mais ces valeurs importent peu.) Réciproquement, toute 
fonction de la forme (**) est solution de (H), clairement. 
Finalement l'expression (**) est la forme générale des solu- 
tions de l'équation y” = -y qui sont à valeurs dans R. 

On peut retenir que les solutions réelles s'obtiennent en 
prenant les parties réelle et imaginaire des solutions com- 
plexes. 


Passons à la démonstration de la proposition. 


Démonstration. Soit y une fonction définie sur un intervalle 
de R, à valeurs dans C. Définissons alors 


y(x) 
y (x) 

s)| =; | (s) 
yx) 

de sorte que 

y (x) 

y ra 
yD) 


Dans ces conditions, la fonction y est solution de (H) exacte- 
ment lorsque 


y (x) 
, y” (x) 
Y (x) = | 


any) (x) + any P(x) +... + 407(x) 


Il se trouve que l’on peut écrire ceci à l’aide d’une matrice. Po- 
sons 


0 1 0 > 0 
0 0 1 :. 0 
A=| à ; Een Ean i 
0 0 0 > 1 
40 4j 42 ` An 


Alors y est solution de (H) si et seulement si Y est solution de 
Y’(x) = AY(x). (V) 


Notons d'ailleurs que si une fonction Y quelconque est solution 
de (V), alors elle doit être de la forme (*). 

Conclusion : avec cette astuce (l'introduction de la bonne 
matrice A), nous avons ramené l'étude de l'équation (H) à 
l'étude de l'équation (V), qui a l'avantage d'être d'ordre 1, 
même si les fonctions en jeu sont cette fois à valeurs vecto- 
rielles. 

L'idée est de diagonaliser A (dans la suite du chapitre nous 
verrons que c'est systématiquement la chose à faire). Si xA est 
le polynôme caractéristique de A, et si x est le polynôme ca- 
ractéristique de l'équation différentielle, il se trouve que l'on 
a 


ka =(-1)" Hx. 


Vous montrerez ceci, à titre d'exercice. En particulier, xa et x 
ont les mêmes racines, et par hypothèse ce sont À6,À1,..., An, 
qui sont distinctes. D'après le corollaire 16.20, la matrice A est 
diagonalisable. 

Nous savons donc qu'il existe une matrice P telle que 


ào 0 0 

0 À 0 
P-'AP = 

0 0 : 

0 0 An 


Appelons D cette matrice diagonale, de sorte que A = PDP-1. 
L'équation différentielle peut alors s'écrire 


Y'(x) = PDP! Y(x) => PHY’ (x) = DP 1 Y(x) 
<> Z'(x) =DZ(x), 


en posant Z(x) =P-!Y(x). 
Comme D est diagonale, cette nouvelle équation est très 
simple. Écrivons 


zx) 


(Si on calculait P, on pourrait exprimer z; en fonction de y, 
mais nous n’aurons même pas besoin de faire ce calcul.) L'équa- 
tion Z'(x) = DZ(x) s'écrit z/(x) = Axzk(x) pour chaque k, équa- 
tion que l’on sait résoudre : on a zy(x) = cpe™*. 

Pour récupérer Y, et donc y, on utilise Y = PZ. On constate 
bien que y(x) est une combinaison linéaire des e^**, comme an- 


noncé. 


Pour résoudre complètement l'équation (E), il faut savoir 
trouver une solution particulière. À cette fin, on peut appli- 
quer des techniques du type « variation des constantes », mais 
les calculs sont souvent compliqués. Il convient de connaître 
un certain nombre d'astuces, et elles seront explorées dans les 
exercices. 


- Fin de la première lecture — 


voir l'exercice 
4055, sauf le (2) 


SYSTÈMES D'ÉQUATIONS DIFFÉRENTIELLES 
[M] 


Un système d'équations différentielles linéaires, à coeffi- 
cients constants, est par définition une équation différentielle 
de la forme 

Y'(x) = AY(x)+ B(x), (E) 


où Y est une fonction à valeurs dans C”, ainsi que B, et A est 
une matrice n x n. L'équation homogène associée est 


Y'(x) = AY(x). (H) 


ExEeMPLE 10.12 — Si l’on souhaite trouver deux fonctions yı 
et y) telles que 


yi(x) = —-15y1(x) + 44v2(x) 
y, (x) —10y1(x) + 27y2(x), 


alors il s'agit bien d’un système d'équations différentielles 
linéaires. En effet en notant 


_[ 31(x) _f -15 44 
el) et a=( -io y 


alors on cherche bien à résoudre Y'(x) = AY (x). 

Noter qu'en pratique les notations peuvent être très dif- 
férentes, par exemple le système peut se présenter sous la 
forme (parfaitement équivalente) 


x(t) = -15x(t) + 44y(t) 
y(t) = -10x(t) + 27%(t). 


Ça sera notamment le cas si l’on pense à t comme au 
« temps », et à t H> (x(t), y(t)) comme à une courbe. Tou- 
tefois dans ce chapitre nous garderons des notations uni- 
formes. 


ExEeMPLE 10.13 - Au cours de la démonstration de la pro- 
position 10.9, nous avons vu que les équations linéaires 
d'ordre supérieur, à coefficients constants, peuvent se ra- 
mener à un système (très particulier). Tout ce que nous 
allons maintenant démontrer sur les systèmes s'applique 
donc à cette situation. 


De nouveau, la proposition 10.1 s'applique : le soin vous 
est laissé de faire cette démonstration très facile. Nous allons 
surtout nous intéresser aux équations homogènes, dans un pre- 
mier temps du moins, et voir quelques techniques pour l’équa- 
tion (E) dans les exercices. 

La méthode pour résoudre l'équation homogène est simple 
et tient en un mot : diagonaliser. Plus précisément : 

1. On commence par tenter de diagonaliser A, donc de trou- 
ver P telle que la matrice D = P-! AP est diagonale. Si c’est 
impossible, on cherchera une matrice P telle que P-lAP 
est la plus simple possible (en première année on vous 
donnera des indications pour ça). 

2. L'équation Y'(x) = AY(x), puisque A = PDP-!, se réécrit 
de la manière suivante : 


Y'(x) = PDP Y(x) => PHY’ (x) = DP 1 Y(x) 
<> Z'(x) = DZ(x), 


en posant Z(x) = PI Y(x). 


3. On note 
z1(x) 


z„(x) 


puis on résout l'équation Z'(x) = DZ(x). Lorsque D est 
diagonale, ceci revient à résoudre une équation simple 
pour chaque zę, et on trouve zę immédiatement. 


4. On retrouve Y(x) par la formule Y(x) = PZ(x). 


Il est important de noter que l'on n'a pas besoin de calcu- 
ler l'inverse de la matrice P, à aucun moment. En effet les tech- 
niques de diagonalisation que l'on a vues permettent de trou- 
ver P telle que P-! AP est diagonale sans calculer P71. 


ExeMPLE 10.14 - Revenons à l'exemple 10.12. La matrice 


est 
-15 44 
^ =| -10 27 | 


Le polynôme caractéristique est xa = A? — 12A +35 = (1- 
7)(A -5), les valeurs propres sont 7 et 5, la matrice est dia- 
gonalisable. On cherche les vecteurs propres, on trouve par 


exemple 
2 11 


associés à 7 et 5 respectivement. On en conclut qu’en po- 
sant 
2 11 
P= ; 


1.5. (7 0\_ 
P ar =| g J 


alors 


On pose alors 
Z(x) =P !Y(x) = | 100 | l 


(On n’a pas calculé P-!.) Alors Z satisfait l'équation Z'(x) = 
DZ(x), ce qui s'écrit 


E = 7z(x) 
= 5z(x). 


N 

D 

= 
R 

2 
| 


On sait bien faire ça : zı (x) = c1e/* et z2(x) = c2e?*. 


Pour finir Y(x) = PZ(x) donc 


7x 


y(x) = 2ce* + 11ce* 
y(x) = ce + 5ce” 


ExEMPLE 10.15 - Parfois la matrice A n'est pas diagonali- 
sable (ça sera évidemment plus rare). Par exemple on peut 
considérer le système 


L = plx) + plx) 
y(x) -71(x) + 3y2(x). 


Le polynôme caractéristique est (À —2)?, et l'espace propre 
associé à l’unique valeur propre 2 est de dimension 1, avec 
pour base par exemple 


me 


La matrice n’est pas diagonalisable. Prenons n'importe 
quel vecteur ez tel que e1, e2 est une base, par exemple 


A 


et soit P la matrice dont les colonnes sont e, et ez. Calcu- 
lons 
-1 {J2 1 | 
PAP = | 0 2 | =D. 
(Un peu de réflexion montre que, quel que soit notre choix 
pour ez, la matrice P-! AP doit être triangulaire, et en cal- 
culant la trace ou le déterminant on s'assure que la dia- 
gonale doit être (2,2). La méthode qui suit ne dépend pas 
vraiment du choix de e3.) 
On continue d'appliquer la méthode. On pose 


Z= PY] zi) | 


On a Z'(x) = DZ(x), ce qui s'écrit 


E = 2z;(x) = > z2(%) 


z,(x) = 2z(x) 


On peut résoudre la deuxième d’abord : zz(x) = c2e?*. En 
remplaçant dans la première, nous obtenons 


z| (x) = 2z(x)- c2”. (*) 


C'est une équation d'ordre 1, que l'on sait résoudre! 
L'équation homogène est zj(x) = 2z,(x) qui a pour solu- 
tions les fonctions de la forme c. e?*. En appliquant la mé- 
thode de variation de la constante, on cherche une solu- 
tion de (*) de la forme c(x)e?* ; on constate que l'équation 
revient à c'(x) = =-c.e?*e ?* = -c;. On prend c(x) = —c,x ce 
qui donne la solution -c2xe?*. Finalement la solution gé- 
nérique de (*) est 
z1 (x) = qe” =caxe?*. 

On retrouve finalement y, et y d'après la relation Y(x) = 
PZ(x), c'est-à-dire 74 (x) = z4 (x) + z2(x) = ca e?* + c2(1 — x)e?* 
et ya(x) = z1 (x) =c e?* — coxe x. 


voir l'exercice 
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ÉTUDE QUALITATIVE DES SYSTÈMES 
E= Q|/5|s|Â|s>È>=> > >> >>> 6 


Nous avons toutes les clefs en main pour résoudre les sys- 
tèmes d'équations différentielles en pratique. À présent, nous 
allons montrer quelques propriétés qualitatives : le calcul de la 
dimension de l'espace vectoriel des solutions, leur forme géné- 
rale, et les intervalles sur lesquels on peut les définir. En deux 
mots, nous trouverons que pour un système n x n, les solutions 
forment un espace de dimension n, on peut les exprimer avec 
des exponentielles et des polynômes, et par conséquent on peut 
naturellement les étendre à R tout entier. Les démonstrations 
font surtout appel à de l'algèbre linéaire. 

Commençons par un petit lemme de calcul. 


Lemme 10.16 — Soit f(x) = P(x)e™, où P est un polynôme. Alors f 
possède une primitive de la forme Q(x)e^*, où Q est encore un po- 
lynôme. Si À + 0, alors degQ < degP ; si À = 0, alors degQ = 
deg P +1. 


Démonstration. Le cas À = 0 est évident donc on se tourne 
vers À + 0. La dérivée de Q(x)e^* est (AQ(x) + Q'(x))e^*. Il suffit 
donc de montrer que pour tout polynôme P, il existe un poly- 
nôme Q de degré < deg P tel que P = ÀQ + Q’. 

Pour montrer ceci, soit n = degP, et soit 


$P: C„[X] => C;fX] 
Q + 1Q+Q'. 


C'est une application linéaire ; regardons ker(b). On a b(Q) = 
0 => ÀQ = -Q’, et si Q # 0 c’est impossible pour des rai- 
sons de degré. Donc ker() = {0}. Par suite, | est injective, et 
donc surjective aussi (corollaire 15.44). Ainsi il existe Q tel 


que p(Q)= P. 


Démonstration. On va procéder par récurrence sur n. Le cas n = 
1 est celui des équations linéaires d’ordre 1 que l’on connaît 
bien, et le théorème est alors évidemment vrai. Supposons donc 
le théorème démontré pour n- 1 et montrons-le pour n. 

Le point essentiel est de comprendre ce qui se passe lors- 
qu'on « remplace » la matrice A par une matrice conjuguée B = 
P-! AP. Comme nous l'avons vu dans les exemples, si Y est une 
solution de Y’ = AY, alors Z = P-!Y est solution de Z’ = BZ, et 
vice-versa. De manière plus savante, on a un isomorphisme 


SA == SB 
Y = PY. 


L'inverse est donné par Z => PZ, bien sür. On en déduit que 
dim S4 = dim Sp. D'autre part, chaque composante z4 de Z est 
une combinaison linéaire des composantes y, de Y (et récipro- 
quement), donc elles ont la même « forme » (combinaisons de 
certains polynômes et d'exponentielles). Conclusion : il suffit 
de montrer le théorème pour B, il sera alors vrai pour A. 

Choisissons donc P telle que la matrice B =P-!AP est de la 
forme 


0 
An-1 A 
0 
* x * u 


C'est possible d'après le corollaire 16.26 (qui dit même que l'on 
peut prendre A„_,. triangulaire inférieure, mais ça ne sera pas 
utile). Notons que 


XA(A) = xp (à) = (p -MXxa,„ , (À), 


comme on le voit en développant par la dernière colonne. En 
particulier p est une valeur propre de A, c'est-à-dire que p = À; 
pour un certain indice io. 

Soit donc Z une solution de Z'(x) = BZ(x), et notons 


z1(x) 
Z{x) = : 
Zn(x) 
Enfin notons 
z1(x) 
Zn-1(x) = : , 
Zn-1(X) 


c'est-à-dire que Z„_, est obtenu en ne gardant que les n—1 pre- 
mières composantes de Z. D’après la forme de B, on constate 
que Z,-1 vérifie Z), ,(x) = A„-1Zn-1(x) (c'est ce que l’on voit 
en ne regardant que les n - 1 premières équations du sys- 
tème Z'(x) = BZ(x)). On a donc une application linéaire 


f: Sg — SA, 
Z => Zy-1: 


Nous allons montrer deux choses : d’une part, que f est sur- 
jective, et d'autre part que dim ker(b) = 1. En effet, supposons 
ces deux choses établies, et appliquons le théorème du rang. 
Nous avons 


dim Sp = dim ker(b)+dim(Im()), 


et par récurrence, on sait que dim Im(@) = dimSa, , =n-1.On 
a donc dimSg = 1+(n-1) = n = dimS4. Ceci donne bien le 
calcul de la dimension au rang n. 

Le plus simple est l'étude de ker(). Si b(Z) = 0, alors Z est 
de la forme 


et l'équation Z'(x) = BZ(x) équivaut à z„(x) = uz,; cette der- 
nière équation est un système d'ordre 1, donc ses solutions 
forment un espace de dimension 1 (et concrètement, z,(x) = 
cel*). Ceci montre que dim ker() = 1. 

Montrons que est surjective. Il faut montrer que, étant 
données des fonctions z,,...,2,_, qui forment une solution 
de Z', (x) = A, 1Z,_1(x), on peut les compléter en une solu- 
tion Z de Z'(x) = BZ(x) en ajoutant une fonction bien choisie z,. 
Or la seule équation du système Z'(x) = BZ(x) faisant interve- 
nir z, est la dernière, qui est de la forme 


Zn (x) = pz„(x) + b(x). (*) 


On sait étudier les équations d'ordre 1 ; en particulier, une telle 
équation possède toujours des solutions lorsque b est continue, 
ce qui est le cas (voir plus bas la forme de b). Donc on peut 
trouver z,, et | est surjective. Ceci conclut la démonstration 
que l'espace des solutions est de dimension n. 

Pour finir la démonstration, il reste à établir que les so- 
lutions ont la forme annoncée, et par récurrence on le sait 
pour Z„-1; reste donc à voir la forme de z„, ce qui va se 
faire en regardant de plus près l'équation (*). Puisque les fonc- 
tions z; sont des combinaisons de polynômes et d'exponen- 
tielles, pour 1<k<n-1,ona 


b(x) = à er 


De plus on a deg P; < m; pour i + ig alors que deg Pj, < mi- 1 
(rappelez-vous la notation : ig est l'indice tel que p = À;, et 
on utilise le fait que À;, comme valeur propre de A,_; a pour 
multiplicité m;, -1). 

La solution générale de (*) est donc 


Z (x) = ce" + c(x)el*, 
où c(x) vérifie 
(= be = Ÿ R HE, 
i 


On peut maintenant appliquer le lemme 10.16. Il nous dit que 
l'on peut choisir c(x) sous la forme 


c(x) = )_ QE, 


où Q; est un polynôme, avec deg Q; < deg P;, sauf si i = io, et 
alors deg Q;, = deg Pj, + 1. Notons alors que le produit c(x)eh* 
peut s'écrire 


c(x)el* = > Qs). 


Ceci montre que z„(x) a précisément la forme annoncée. 


Nous pouvons revisiter les exemples étudiés ci-dessus à la 
lumière du théorème. 


ExEMPLE 10.18 - Le système de l'exemple 10.12 était 


Li —15y1(x) + 44v2(x) 
v5(x) = -10971(x) + 27y(x), 


la solution était donnée dans l'exemple 10.14. On a vu que 
le polynôme caractéristique était (A-7)(A-5). Le théorème 
nous affirme alors que y, est de la forme 


y(x) = ae”™ + be”, 
où a et b sont des constantes, et que y, est de la forme 
ya(x) = ce™ +de, 


Attention : le théorème ne dit certainement pas que, réci- 
proquement, on obtient des solutions en prenant a,b,c,d 
arbitrairement ; d’ailleurs on ne s’attend pas à avoir 4 pa- 
ramètres libres alors que le théorème nous dit également 
que l’espace des solutions est de dimension 2. 

En fait, nous avions fait les calculs et trouvé que 


7x 


11 (x) = 2c e7* + 11c,e?* 
p(x) = er + bee 


où c et c) sont des constantes arbitraires (il y en a bien 2!). 
Regardons de même l'exemple 10.15, pour lequel le 
système est 


L = p(x) + plx) 
y(x) =yı(x) +  3y2(x). 


Le polynôme caractéristique est (À — 2)?. Le théorème af- 
firme donc que 


11 (x) = ae?* + bxe™, 


et 
pa(x) = ce + dxe?*, 


où a,b,c,d sont des constantes ; l’espace des solutions est 
de dimension 2 donc il doit y avoir des relations entre ces 
constantes. Nous avions fait les calculs et trouvé que 


2 2x 
, 


31 (x) = (c1 + co)e* — coxe 


et que 


yalx) = cie — coxe”, 


avec deux constantes arbitraires c, et c3. 


Les résultats prédits par le théorème sont donc cohérents 
avec ceux que l’on avait obtenus directement. Le théorème à 
lui seul ne donne pas assez d’information pour résoudre le sys- 
tème, et d’ailleurs on s’en passe. Mais l'intérêt de cet énoncé 
abstrait est de dire au moins quelque chose dans les cas où un 
calcul direct n'est pas envisageable, par exemple si la matrice 
est très grande, où si elle dépend elle-même de paramètres 
d’une manière compliquée. 


RETOUR SUR LES ÉQUATIONS D'ORDRE SUPÉRIEUR 
mm 


Pour se convaincre de l'intérêt du théorème 10.17, voici 
une conséquence concrète : nous pouvons maintenant ré- 
soudre toutes les équations différentielles linéaires d'ordre su- 
périeur, à coefficients constants. Rappelons que dans la propo- 
sition 10.9 nous avions seulement traité le cas où les racines du 
polynôme caractéristique étaient distinctes. 


ProposirioN 10.19 - On considère l'équation homogène 


pr (x) ay” (x) +--+ 407(x). (H) 
Soit 
xA) = antl PR ENa dog e ag] = (A - À)" -. (À As)” 


le polynôme caractéristique, factorisé sur C. Alors toute solution y 
de (H) peut s'écrire de manière unique 


s mj-l 
yo- È ewan, 
j=l y 


et réciproquement pour tout choix de coefficients cij, une fonction 
de cette forme est solution. 


Démonstration. On reprend le début de la démonstration de la 
proposition 10.9 : on pose 


0 1 0 0 

0 0 1 0 
Bel i i h & o ip 

0 0 0 0 1 

ag 4j a) t An 


et alors on constate que Y est solution de Y'(x) = AY(x) si et 
seulement si elle est de la forme 


avec y solution de (H). 

Si on note SA l’espace des solutions de Y’ = AY, et Sy l’es- 
pace des solutions de (H), alors on a un isomorphisme SA > SH 
donné par Y H> y; l'inverse envoie y sur la fonction Y définie 
par (*). On en conclut, d’après le théorème 10.17, que dim Sy = 
dimSa=n+1. 

Or, d’après le même théorème, on sait que y doit avoir pré- 
cisément la forme annoncée dans la proposition (rappelons que 
le polynôme caractéristique de A est, au signe près, le poly- 
nôme caractéristique considéré dans l'énoncé). 

Il est facile de conclure. Soit ej; la fonction définie sur R 
par eij(x) = xle"i*, pour 1 < i < s et 0 < j < m;. Ces fonc- 
tions sont au nombre de n +1, qui est le degré du polynôme x. 
Considérons alors l'espace vectoriel E = Vect(e;;) (c'est un sous- 
espace de l’espace de toutes les fonctions R > C). Il est donc 
de dimension < n + 1. Mais on vient de voir que Sy C E et 
que dim Sy = n +1. On en conclut que Sy = E et que dim E = 
n +1; de plus la famille des e;; doit donc être libre. 

On a donc bien montré que chaque e;; € Sp, donc est solu- 
tion de (H), et que chaque solution de (H) s'écrivait de manière 
unique comme combinaison linéaire de ces fonctions. 


ExEMPLE 10.20 - Considérons l'équation 

yx) + 39"(x) + 39/00) + (x) = 0. 
Le polynôme caractéristique est A3 + 312 +31 +1 = (A+ 
1)3. On en conclut que les solutions sont précisément les 
fonctions de la forme 


(a+bx+cx?)e*, 


où a, b et c sont des constantes arbitraires. 


reprendre le (2) 
de l'exercice 
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UTILISATION DE L’EXPONENTIELLE MATRICIELLE 


Le lecteur ayant parcouru la deuxième partie de l’appen- 
dice « L'exponentielle » connait les exponentielles de matrices. 
Rappelons que si A est une matrice, alors par définition 


La proposition B.24 affirme alors que la fonction y(x) = e*^ vé- 


rifie y’(x) = Ae*^. On aperçoit alors une nouvelle façon de pro- 
duire des solutions de nos systèmes d'équations différentielles : 
en effet, pour tout vecteur v € C", si on pose Y(x) = eA y, 
alors Y'(x) = Ae*^ v = AY(x). 

Et toutes les solutions sont en fait de cette forme : 


Proposition 10.21 — Soit Y une solution du système Y'(x) = 
AY(x). Alors Y est de la forme Y(x) = e*^ v pour un certain vec- 
teur v ; par suite v = Y(0). Réciproquement toutes les fonctions de 
cette forme sont solutions. 

En particulier, une solution Y de ce système est entièrement dé- 
terminée par le vecteur Y(0). 


Démonstration. Nous avons déjà vu la partie « réciproque ». On 
doit montrer que toute solution Y est de cette forme. 

Il y a deux démonstrations faciles. La première consiste à 
adapter la démonstration de la proposition 10.2, en remplaçant 
l'exponentielle usuelle par l'exponentielle de matrice. Il n'y a 
presque rien à changer (et le peu qu'il y a à changer a en fait 
été vu lors de la démonstration de la proposition B.24). 

Voici la deuxième démonstration. On considère l'applica- 
tion |: Sa > C” définie par |(Y) = Y(0) (comme d'habitude S4 
est l'espace vectoriel des solutions du système). L'application p 
est évidemment linéaire. De plus, elle est surjective, puisque 
pour tout v € C”, la solution Y € SA définie par Y(x) = e*^v vé- 
rifie Y(0) = v. D'après le théorème 10.17, la dimension de S4 
est n, et on en conclut que ọ est injective également. Ceci 
montre que Y est déterminée par v = Y(0). Ainsi, la seule so- 
lution Y telle que Y(0) = v est Y(x) = e*v. 


Il semblerait que nous ayons donné une formule simple 
pour exprimer les solutions de Y’(x) = AY(x), et en un sens c'est 
le cas. Mais il ne faudrait pas croire que cette formule va nous 
dispenser de la méthode que nous connaissons pour résoudre 
un tel système en pratique. En effet, le calcul de e^ est compli- 
qué, et se fait...en diagonalisant A (voir l'exemple B.23). On 
ne gagne pas vraiment de temps en procédant ainsi. 

Par contre, le fait qu'une solution Y est déterminée par Y(0) 
est nouveau. Vous verrez l'an prochain qu'il y a là un phéno- 
mène général dans la théorie des équations différentielles. 


EXEMPLE 10.22 — De nouveau, retournons à 
l'exemple 10.12, donc au cas où 


-15 44 
^=( io 27 ) 


Les solutions de Y'(x) = AY(x) sont, d'après la proposition, 
de la forme e*Av, et nous devons donc commencer par cal- 
culer e*^. On a vu (exemple 10.14) que 


iu] 7 0 N _[ 2 11 
= V 5 =D avec P= 5 |: 


On en tire xA =P(xD)P-! et 
e*A = Pe*Pp 1 


voir la proposition B.22. De plus comme xD est diagonale, 


on a évidemment 
xD _ e’* 0 
e =V o ex] 


On veut s'éviter le calcul de P-! (rappelons que nous 
n'avons pas eu besoin de faire ce calcul pour diagonali- 
ser A). On va donc garder le résultat sous cette forme, et 
écrire qu'il existe un vecteur v tel que 


Ts 5x 
Y(x) = e*Ay = Pe*PP-ly = | p = ju, 


en posant w = P-!v. On sait que v peut être choisi libre- 
ment, donc w peut être choisi librement ; en posant 


c 
i 7 | ; | i 
C2 
on retrouve le résultat de l'exemple 10.14, à savoir que Y 
est de la forme 
_f 2c1e7*+11ce* 


Y= | c e7* + 5c7e?* | | 


Cette méthode n’est ni plus rapide, ni plus lente que la pré- 
cédente. 


reprendre les 
systèmes 
précédents par 


cette méthode 


Troisième partie 


Algèbre 


Chapitre 11 


Polynômes 


Dans ce chapitre, et dans toute la partie « Algèbre », la 
lettre K désigne Q, R ou C. Le lecteur ayant assimilé la défi- 
nition 2.17 peut prendre pour K n'importe quel corps. 


DÉFINITIONS & NOTATIONS 


DériniTiIoN 11.1 - Donnons-nous un symbole X. Un polynôme 
en X à coefficients dans K est une expression formelle 


dh HON tooo OX" 


avec 4, + 0. L'entier n est appelé le degré du polynôme. 
L'ensemble de ces polynômes est noté K[X], et le sous- 
ensemble des polynômes de degré < n est noté K, [X]. 


Les termes « symbole » et « expression formelle » sont à 
comprendre de manière intuitive : disons qu’un polynôme est 
une écriture. Si vous trouvez ça insatisfaisant, essayez l’enca- 
dré « Définition complète des polynômes ». Pour tout le monde, 
précisons que l’on autorise aussi le « polynôme nul », dont 
tous les coefficients sont O (et pour lequel on prend parfois la 
convention de dire que son degré est -œ afin que certaines for- 
mules restent vraies). 


Définition complète des polynômes 


À un interlocuteur exigeant et rigou- YË = @ 3 = (00104072) 
reux, où à un ordinateur, nous di- 
rions qu'un polynôme est défini par 
ses coefficients, et puis nous indi- 
querions les règles de calcul sur ces 
coefficients. Voici les détails. 
Considérons les fonctions N > K, 
autrement dit les suites d'éléments 
de K. Une telle suite a sera notée 


et de même on constate que X” est 
représenté par une suite de 0, sauf 
à la position n où l'on trouve un 1 
(faire une récurrence simple). 
Finalement, soient 40, 41,...,4n des 
éléments de K. Si l'on calcule ag @ 
a  @X@-> @a„ @ X", on trouve 


a = (ag,a1,42,...), 
avec a„ = a(n). 
On définit une addition @ le plus 
simplement du monde : si b = 
(bo, b1,...), alors nous définissons 


oar ran 010)? 


On peut finalement définir K[X] 
comme étant l'ensemble des 
suites a : N —> K telles que a(k) = 0 
pour tous les k supérieurs à un cer- 
tain n € N appelé le degré. Les opé- 
rations sont celles ci-dessus, et on 
va écrire P+Q et PQ au lieu de P&Q 
et P @ Q, pour simplifier. On vérifie 
alors que tout polynôme P s'écrit de 
manière unique 


a@ b = (ag + bo, a1 + b1, a2 + b2,...). 
Définissons maintenant une multi- 
plication @, qui paraît bien plus tor- 
due :a@b=(cp,c1,c2,...), où 


n 
c= Ò a bn-p- 
p=0 


(On appelle ceci la «formule de Car- 
tan ».) 

On peut vérifier directement que 
l'ensemble des fonctions N > K, 
avec ces opérations, est un anneau 
commutatif (cf. définition 2.17). 
Première remarque : en identi- 
fiant x € K avec la suite (x, 0, 0,0,...), 
on peut considérer que K est 
contenu dans cet ensemble de 
suites. De plus cette identification 


P=ag+aX+...+anX". 


Par analogie, une suite quel- 
conque a : N — K peut être notée 


) n 
anX , 


n>0 


et appelée une série formelle, lors- 
qu'on veut faire référence aux opé- 
rations d’addition et de multiplica- 


est compatible avec l'addition et la 
multiplication sur K. 

Soit maintenant X = (0,1,0,0,0,...), 
c'est-à-dire X(n) = 0 sauf sin = 1, 
et X(1) = 1. Essayons quelques cal- 
culs : 


X2=X@X=(0,0,1,0,0,...), 


tion que l'on vient de définir. At- 
tention cependant : cette notation 
ne doit pas donner l'illusion d'une 
somme «infinie » ou d'un passage à 
la limite. 

On note K[[X]] l'ensemble des sé- 
ries formelles. 


Par exemple, P = 1 + 5X + 3X? est un polynôme de Q[X], 
et Q=7+X+iX2+(2-4i)X$ e C[X]. Noter que 3 -X? est aussi 
un polynôme, en notation raccourcie pour 3 + 0X + (—-1)X2. 

Lorsque l’on dispose d’un polynôme P € K[X] et d’un éle- 
ment x € K, on peut donner un sens à P(x). Sans surprise, si 


P=ao+aX+...+a,X", 


alors 
P(x)=ag+ajx+ >+ a x". 


On dit que l'on évalue P en x. Si P = 1 + X2, alors P(=2) = 1 + 
(-2)? = 5, par exemple. Cette opération est tellement commune 
que l'on note souvent P(X) (au lieu de P tout simplement) pour 
un élément de K[X], afin de rappeler cette possibilité d'évaluer. 

Un polynôme donne naissance à plusieurs fonctions. Pre- 
nons P =-12X3+7X` ; on peut considérer la fonction 


R => R 
x H P(x)=-12x3+7x). 


Mais on peut aussi regarder 


C = C 
z H> P(z)=-1223+72?, 


et il y aurait aussi la fonction [0,1] — R qui à x associe P(x), etc. 


ARITHMÉTIQUE ET DIVISION EUCLIDIENNE 
EEE c= Kai] 


On peut additionner les polynômes de façon naturelle, co- 
efficient par coefficient. Par exemple si P = 1 + X? et Q = 
-1 -3X + X?, alors P +Q = -3X + 2X? =Q +P. 

La règle de commutativité P+Q = Q +P est générale, et per- 
met d'écrire les sommes dans n'importe quel ordre. En prenant 
P = 4X?, Q =5X et R = 2, on a ainsi P +Q +R = 4X? +5X +2 = 
2 +5X + 4X? = R+Q + P. Maintenant que cette observation 
est faite, nous pourrons écrire les termes des polynômes dans 
l’ordre qui nous convient le mieux. 

On a également une multiplication : sans surprise, on dé- 
veloppe puis on regroupe les termes. Si P = X? — X + 2 et Q = 
2X° —3 alors 


P-Q=2X7-2X*+4X? -3X?+3X-6=Q-P. 


De nouveau, la règle P-Q =Q - P est générale. (Là encore, les 
amateurs de détails se rapporteront à l'encadré précédent.) 

Après quelques essais, on se rend compte qu'on ne peut pas 
toujours diviser : par exemple si P = X? -1 et Q =X +2, il n'y 
a pas de polynôme R qui mériterait de s'appeler 5 c'est-à-dire 
qu'il n'y a pas de polynôme R tel que QR = P. Pour montrer 
ceci, on note que si R existait, il serait de degré 1, disons R = 
aX + b. Or l'équation QR = P donne en développant : 


aX?+(2a+b)X+2b=X?-1, 


et en comparant les coefficients, on obtient a = 1, b = <, et 2a+ 
b = 3 = 0, contradiction. 

Parfois, on peut avoir de la chance : pour le même P, et 
pour Q =X+1,on a P = X? -1 =(X-1)(X +1) = (X -1)Q 
donc © =X-1. 

En général on dit que Q divise P lorsqu'il existe un poly- 
nôme R tel que P = QR. Dans ce cas, et dans ce cas seulement, 
on pourra noter R = 5 (ce qui a un sens car R est unique : exer- 
cice !). On utilise la notation Q | P pour indiquer que Q divise P. 
Il faut se méfier de cette notation (standard malheureusement) 
qui apparaît symétrique alors que les rôles de P et Q sont très 
différents. 

La situation des polynômes est très similaire à celle des 
nombres entiers : on peut parfois diviser un entier par un autre, 
parfois « ça ne tombe pas juste ». Dans tout ce chapitre on va in- 
sister sur les similarités, et nous commençons par les divisions 
euclidiennes. 

Rappelons que, si a et b + 0 sont des nombres entiers, 
il existe deux nombres entiers q (le quotient) et r (le reste), 
uniques, tels que 

a=bq+r, 


avec 0 <r < b. 


ProposirioN 11.2 — Soient A et B + 0 deux polynômes de K[X]. 
Alors il existe deux polynômes Q (le quotient) et R (le reste), 
uniques, tels que 

A=BQ+R, 


avec deg R < deg B. 


Démonstration. Montrons l'unicité. Si A = BQ +R et A =BQ' + 
R’, en faisant la différence on obtient 


B(Q-Q')=R'-R. 


Le degré de R’ -R est < deg B. On en déduit que Q - Q’ = 0, 
sinon le degré de B(Q -Q') serait > deg B. Donc Q = Q’ et par 
suite R =R'. 

Pour l'existence de Q et R, nous allons donner directement 
une méthode de calcul. 


ExEMPLE 11.3 — Prenons A = 4X3 —2X? +1 et B=X2+X+1. 
On commence par présenter la division comme pour les 
nombres entiers : 


4X3 2x? +1 | X2+X+1 


Puis on évalue «en 4X3, combien de fois X? ? » Réponse, 
4X. On calcule alors 4X -B =4X3+4X2+4X, et l’on soustrait 
ce résultat au polynôme A. On présente ces calculs de la 
manière suivante : 


_4X? -2X? +1 |X? +X+1 
4X3 +4X? +4X 4X 
—6X? -4X +1 


On recommence avec «en —6X?, combien de fois X? ? », 
réponse —6 : 


_4X$ -2X? +1 | X2+X+1 
4X? +4X2 +4X 4X -6 
-6X? -4X +1 
` —6X2 -6X —6 
2X +7 


C'est terminé : lorsque l’on obtient à gauche un poly- 
nôme de degré inférieur à celui de B, c'est le reste, ici R = 
2X +7. Le quotient est Q = 4X — 6. On peut vérifier direc- 
tement que À = BQ +R. 


ExEMPLE 11.4 - Dans ce qui suit, les divisions euclidiennes 
vont être d’une grande utilité, mais pour l'instant vous 
vous demandez peut-être quel intérêt on pourrait bien 
avoir à diviser des polynômes. Voici alors une petite astuce 
de calcul qui les fait intervenir. Soit 


. —-1+iV3 
j=— >: 


C'est une solution de X? + X +1 = 0, c'est-à-dire que j? + 
j +1 =0 (proposition 2.16). Combien vaut 4j3 -2j?+1? Si 
l'on commence par développer (ES à de manière naïve, 
on va perdre pas mal de temps. Alors que nous venons de 


démontrer que 
4X? - 2X? +1 = (4X - 6)(X? +X +1)+2X +7, 


ce qui donne en évaluant en X = j la réponse 4j°-2j?+1 = 
2j+7=6+iV3. 

Notez bien que la division euclidienne ne fait interve- 
nir que des nombres entiers (et aucune V3), et qu'elle s’ef- 
fectue très vite, avec l'habitude. Vous aviez peut-être réussi 
à calculer 4j° — 2j? +1 rapidement en écrivant j? = -1 - j, 
donc P ==] _ j? = 1. Bravo, mais la méthode de la division 
euclidienne ne fait rien d'autre que d'organiser ces calculs. 
Avec des nombres encore plus compliqués que ce j, il de- 
vient très difficile de trouver des astuces au coup d'œil. 


voir les exercices 
364, 375 


RACINES 
a 


DÉFINITION 11.5 — Soit P € K[X] un polynôme, et soit r € K. On 
dit que r est une racine de P lorsque P(r) = 0. (Parfois on dit 
que r est une solution de P, et parfois on dit (assez curieuse- 
ment, d’ailleurs) que r est un zéro de P.) 


PropPosirion 11.6 — Le nombre r € K est une racine de P si et seule- 
ment si le polynôme X =r divise P dans K[X]. 


Démonstration. On écrit la division euclidienne de P par X-r: 
P=(X-r)Q +R. 


Ici le degré de R doit être < 1, donc R est de degré 0 (on dit que 
c'est une « constante »). En faisant X = r, ceci devient P(r) = R, 
donc finalement 

P =(X =r)Q + P(r). 


Il est alors clair que P(r) = 0 & (X =r) | P. 


La démonstration indique clairement que pour trouver ex- 
plicitement le polynôme z=, le plus simple est d'effectuer une 
division euclidienne. 


ExEMPLE 11.7 — Soit P = 5X2-15X+10. Ce polynôme a deux 
racines, à savoir 1 et 2. Il doit donc être divisible par X - 
1 en particulier, et en faisant la division euclidienne on 
obtient 


5X?2-15X+10=(X-1)5X-10)=5(X-1)(X—2), 


ce qui confirme que P est également divisible par X — 2. 


D'une manière générale, si P a une racine rı on peut écrire 
P=(X-7r)Q, et si Q; a une racine ro on peut écrire Qı = 
(X -= r2)Q2 donc P = (X -n11)(X = r2)Q2; si Q2 a une racine r3 
on aboutit à P = (X — r1 )\(X - r2 )(X - r3)Q3... Peut-on continuer 
comme ça indéfiniment ? En d’autres termes, est-ce que chaque 
polynôme de K[X] va toujours posséder au moins une racine 
dans K? 

La réponse est non, tout d’abord parce que les polynômes 
constants, de la forme P(X) = c, avec c € K, n’ont aucune ra- 
cine si c + 0. Si maintenant deg P = n > 1, on observe que les 
degrés successifs de Q1, Q2,..., ne font que diminuer, donc si 
l'on peut trouver n racines successivement comme ci-dessus le 
polynôme Q, sera de degré 0 donc constant et non-nul. On ne 
peut alors pas continuer avec Q„. 

Au passage nous avons presque démontré le résultat sui- 
vant : 


ProposirioN 11.8 - Un polynôme de degré n ne possède pas plus 
de n racines distinctes. 


Démonstration. Supposons en effet que l'on ait n +1 racines 
distinctes, disons r1,r2,...,r,,1. On commence par écrire P = 
(X-r1)Q1 comme ci-dessus. Ensuite, puisque P(r;,)= 0, on écrit 


P(r)=(r-")Q1(r)=0, 


et comme rı # ro par hypothèse, on doit bien avoir Q;(r2) = 0. 
On peut donc factoriser et obtenir Q1 = (X — r2)Q2. On recom- 
mence avec Q), et ainsi de suite on aboutit à 


P=(X=ri)(X -= r2) (X -= fn+1)Qn+1: 


Cette dernière égalité est absurde puisque le membre de droite 
a un degré > n+1. 


Mais il n’y a pas que les polynômes constants qui n’ont pas 
de racines. L'exemple le plus fameux est P = X? +1 € R[X] et 
qui ne possède pas de racine dans R, puisque le carré d’un réel 
est toujours positif et ne saurait valoir -1. Dans le même ordre 
d'idées, le polynôme Q = X? -2 € Q[X] n’a pas de racine dans Q 
d’après la proposition 2.1. 

Dans un cas comme dans l’autre, on peut considérer ces 
polynômes comme des éléments de C[X], et ils ont bien sür 
des racines dans C. Rappelez-vous qu'en parlant de C nous 
avions prédit que nous gagnerions bien plus que des racines 
carrées supplémentaires en travaillant avec les complexes. Le 
théorème suivant affirme en effet que toute équation polyno- 
miale P(z) = 0 a une solution dans C! 


THÉORÈME 11.9 (THÉORÈME FONDAMENTAL DE L'ALGÈBRE) — Tout 
polynôme de degré > 1 dans C[X] possède une racine dans C. 


On dit que « C est algébriquement clos ». Voir le théo- 
rème B.16, en appendice, pour une démonstration. 


CoroLLAIRE 11.10 - Tout polynôme de C[X] de degré n peut 
s'écrire de manière unique 


P = A(X =r1)(X = r2) (X = rn). 


Démonstration. L'existence d’une telle écriture est claire à ce 
stade, mais comme nous énonçons l'unicité aussi on va pru- 
demment faire une récurrence. Supposons le résultat vrai pour 
les polynômes de degré n — 1 (pour n = 0 c’est évident). Soit P 
de degré n. 

On peut trouver une racine rı pour P d’après le théorème, 
donc P =(X-r;)Q. Par récurrence on sait que Q = MX - r2)(X — 
rz) +++ (X =r„), d’où l'écriture annoncée pour P. 

Vérifions qu'elle est unique. Si 


P =#(X=71)(X = 32) >> (X -= Ym)» 


on sait déjà que m = n = deg P et que p = À = le coefficient de X” 
dans P. Comme P(r) = 0, on peut écrire 


pri -971)(11 = y2) (11 Yu) = 0, 


donc rı - y; = 0 pour un certain indice i; quitte à renuméroter, 
on peut supposer que i = 1, donc y; = 11. 

Le quotient dans la division de P par (X — rı), qui est uni- 
quement déterminé, peut donc être calculé de deux façons dif- 
férentes, ce qui donne l'égalité 


Q = MX -72)(X =- y3): (X =u) 


Par récurrence, on sait que cette écriture est unique, c'est-à-dire 
que (quitte à renuméroter) on a x; = y; pour tous les indices i. 


La situation pour les polynômes de R[X] est à peine plus 
compliquée. Faisons une remarque simple : 


Lemme 11.11 — Soit P € R[X], et soit r € C une racine de P. Alors 
le nombre conjugué T est également racine de P. 


Démonstration. Si P(r) = 0, on a aussi P(r) = 0 = 0. Mais comme 
P(r)=ag+ajr +++ apr" 


avec 4; = a; (puisque a; € R), on constate que 


P(r)=ag+@r+..+a,r" =P(r) =0. 


Proposition 11.12 — Soit P un polynôme de R[X]. On peut écrire 
de manière unique 


P = A(X =x1)(X =x2) > (X - xi)Q1Q2 -Qj 


avec xj E€ R et Qg un polynôme de degré 2 dans R[X] sans racine 
réelle. 


Démonstration. D’après le corollaire, on peut écrire 
P= A(X=1)(X=r12)++(X=fhn), 


avec rç € C. Ceux de ces nombres qui sont en fait dans R vont 
être notés x1,X2,...x;. Les autres racines rą qui ne sont pas 
réelles sont regroupées en paires : en effet d'après le lemme, 
si r. est une racine de P, alors rç aussi (et 7; + r; dans ce cas). 
Le facteur 


(X =1p)(X-7g) = X? -2Re (rs) X + [rp]? 


est un polynôme de R[X] de degré 2, sans racine réelle. La pro- 
position s'en déduit. 
L'unicité est laissée en exercice. 


voir les exercices 
401, 412, 423 


Diviseurs DANS C[X] 
n_a 


Que peut-on dire de l’ensemble des diviseurs d’un poly- 
nôme P donné? Tout d’abord, notons que si P = QR, on peut 
écrire pour tout scalaire À # 0 que P = (AQ)(ÀR); en d'autres 
termes, si Q divise P, alors AQ divise aussi P, et en particu- 
lier P a un nombre infini de diviseurs. 

Pour éviter cette complication inutile, nous dirons qu'un 
polynôme aÿ+4X+4aX?2+-..+a,X" est unitaire si a, = 1. Une 
meilleure question est donc : que peut-on dire de l’ensemble 
des diviseurs unitaires d’un polynôme donné? Notons que, à 
regarder les définitions, il n’est pas a priori évident de savoir 
s’il en existe un nombre fini ou non. 

Grâce au corollaire 11.10 cependant, on va pouvoir étudier 
facilement l’ensemble des diviseurs d’un polynôme complexe. 
Introduisons la notation suivante : pour un nombre complexe z 
et un polynôme P € C[X], le nombre m,(P) est le plus grand en- 
tier tel que (X — z)":1°) divise P. On va l'appeler la multiplicité 
de z comme racine de P. On remarque que m,(P) > 0 si et seule- 
ment si z est racine de P, ce qui n'arrive que pour un nombre 
fini de nombres z. Le corollaire 11.10 peut s'écrire 


P = a| [Xx =z)", 


zeC 


sachant que ce produit ne comporte qu'un nombre fini de 
termes (les autres sont égaux à 1). Le lemme suivant est alors 
évident. 


Lemme 11.13 — Les multiplicités ont les propriétés suivantes. 
1. m;(P P2) = mz(Pi) + mz(P2). 
2. Q divise P si et seulement si m,(Q) < m,(P) pour tout 
nombre complexe z. 


3. P ne possède qu’un nombre fini de diviseurs unitaires. 


Démonstration. La démonstration (très simple) des points (1) et 
(2) est laissée en exercice. Pour le (3) notons qu’un polynôme 
unitaire Q s'écrit 


Q| JEn, 


zeC 


et lorsque Q divise P le nombre entier m,(Q) doit vérifier 0 < 
m;(Q) < m,(P) d'après le point (2). Il n'y a qu’un nombre fini 
de nombres complexes z pour lesquels m,(P) + 0, donc au total 
il n’y a qu’un nombre fini de choix pour Q. 


On peut alors poser la définition suivante. 


DÉFINITION 11.14 — Soit P et Q deux polynômes de C[X]. Le 
polynôme pgcd(P,Q) est par définition 


pged(P, Q) = | |X- zinta, 
zeC 


Lemme 11.15 — Le polynôme pgcd(P,Q) divise P et divise Q. De 
plus si D est un polynôme qui divise P et Q, alors D divise égale- 
ment pgcd(P,Q). En particulier pgcd(P,Q) est l'unique diviseur 
unitaire de P et de Q de degré maximal. 


On comprend donc pourquoi pgcd(P,Q) est appelé le plus 
grand diviseur commun de P et Q. 


Démonstration. D'après le (2) du lemme précédent, il est clair 
que si D | P et D | Q, alors D | pgcd(P,Q), et donc que deg(D) < 
deg(pgcd(P,Q)). 

Vérifions l’unicité. Soit D un diviseur unitaire de P et de Q 
dont le degré est maximal. On a D | pgcd(P,Q) donc deg(D) < 
deg(pgcd(P,Q)) d’où par maximalité deg(D) = pgcd(P,Q). Par 
suite D = pgcd(P,Q) puisqu'ils sont tous les deux unitaires. 


Cette approche des pgcds a pas mal de défauts. Pour com- 
mencer, il est difficile de calculer pgcd(P,Q) par la définition 
ci-dessus : il faut d’abord factoriser entièrement P et Q! En- 
suite, si K n’est pas C, on ne sait rien dire. Vous arriverez cer- 
tainement à traiter le cas IK = R à l’aide de la proposition 11.12 
(en lieu et place du corollaire 11.10), mais pour K = Q on est 
dans une impasse. 

Dans la suite du chapitre on va indiquer une toute autre 
méthode, plus générale et entraînant des calculs assez faciles. 
Par contre les définitions sont moins directes. 


- Fin de la première lecture — 


PLUS GRAND DIVISEUR COMMUN 
mm mmm mmm 


DérFiniTIoN 11.16 — Soient A et B deux polynômes (ou deux 
nombres entiers). L'ensemble des diviseurs communs à A et à B 
est noté div(A, B). 


Notez que div(A,0) est l'ensemble des diviseurs de A (tout 
polynôme P divise le polynôme nul, puisque 0 = 0 x P). 


Lemme 11.17 - Soient A et B + 0 des polynômes (ou des nombres 
entiers). Ecrivons la division euclidienne A =BQ + R. Alors 


div(A, B) = div(B,R). 


Démonstration. Si D divise A et B, alors il divise R = A—BQ (en 
effet si A = A'D et B = B'D alors R = (A' - B'Q)D). Réciproque- 
ment si D divise R et B, alors il divise A, par le même raisonne- 
ment. Donc les diviseurs à considérer pour la paire (A,B) sont 
les mêmes que pour la paire (B,R). 


Pourquoi est-ce utile ? Tout simplement parce qu'en passant 
à (B,R), les degrés (ou les nombres) sont plus petits. On peut 
ensuite recommencer avec (B, R), et recommencer encore, et on 
va finir par obtenir une paire de la forme (P,0) : en effet tant 
que le deuxième terme n'est pas nul, on fait une nouvelle divi- 
sion euclidienne, et on obtient un nouveau terme strictement 
plus petit. En fait on a : 


Proposirion 11.18 — Soient A et B des polynômes. 


1. Il existe un unique polynôme unitaire P tel que 
div(A, B) = div(P,0). 


On le note pgcd(A, B). 
2. Si D divise A et B, alors D divise également leur pgcd. 


3. Le polynôme pgcd(A,B) est également caractérisé comme 
l'unique diviseur unitaire commun à A et à B dont le degré 
est maximal. 


4. Si on effectue une division euclidienne A = BQ + R, alors 
pgcd(A, B) = pgcd(B,R). 


Cette définition du pgcd est donc cohérente avec la défini- 
tion 11.14 lorsque K =C (à cause du point (3)). 


Démonstration. (1) Nous venons d’expliquer comment, en ap- 
pliquant le lemme précédent suffisamment souvent, on trouve 
un polynôme P tel que div(A,B) = div(P,0); on peut suppo- 
ser P unitaire. Montrons l'unicité. Si div(P,0) = div(P’,0), alors 
comme P | P on a aussi P | P’; et réciproquement comme P’ | P’ 
on a P’ | P. Finalement P et P’ se divisent l’un l’autre, et sont 
unitaires, donc P = P’. Le polynôme P est bien unique, et on 
peut le noter pgcd(A, B). 

(2) L'assertion sur D n’est qu’une traduction de l'égalité 
entre div(A, B) et div(P,0). 

(3) Soit D € div(A, B) de degré maximal. On a D | pgcd(A, B), 
donc deg(D) < deg(pgcd(A,B)) d'où par maximalité deg(D) = 
pgcd(A,B). Par suite, on a bien D = pgcd(A,B) puisqu'ils sont 
tous les deux unitaires. 

(4) D'après le lemme précédent, on a div(A, B) = div(B,R), 
donc c’est évident. 


Avant de donner des exemples, remarquons que la situation 
avec les nombres entiers est exactement similaire. En fait on a : 


PropPosirioN 11.19 — Soient a et b des nombres entiers. 
1. Il existe un unique entier positif p tel que 
div(a, b) = div(p, 0). 


On le note pgcd(a, b). 
2. Si d divise a et b, alors d divise également leur pgcd. 


3. Le nombre pgcd(a, b) est également caractérisé comme le plus 
grand diviseur commun à a et à b (!). 


4. Si on effectue une division euclidienne a = bq +r, alors 
pgcd(a, b) = pgcd(b,r). 


La démonstration est la même. Voyons des exemples. 


ExEMPLE 11.20 - Commençons par des nombres entiers, 
disons par exemple a = 77 et b = 91. On écrit 


91=77x1+14, 
donc pgcd(91,77) = pgcd(77, 14). Puis 
77 =14x5+7, 
donc pgcd(77,14) = pgcd(14,7). Finalement 
14=7x2+0, 


donc pgcd(14,7) = pgcd(7, 0) = 7. Au total pgcd(77,91) =7. 


ExEMPLE 11.21 — Prenons A = X?+7X2+2X +14 et B = 
X4+4X2 +4, dans R[X]. On calcule 


B =(X-7)-A+(51X? +102), 


donc pgcd(B, A) = pgcd(A, R) avec R = 51X?+102 (on passe 
les détails du calcul de la division euclidienne). Puis on 
effectue 

1 7 

A=(=ÂX+-=)-R+0, 

51 51 
donc pgcd(A, R) = pgcd(R, 0). Attention, comme le pgcd est 
un polynôme unitaire par définition, ici la réponse n'est 
pas R =51(X?+2) mais X? +2 : on divise simplement par le 
coefficient du terme en X?. Finalement pgcd(A, B) = X?+ 2. 


À propos, la méthode de calcul du pgcd que nous venons 
d'appliquer, à base de divisions euclidiennes successives, s’ap- 
pelle l'algorithme d’Euclide. 


voir les exercices 
379, 380 


LE THÉORÈME DE BÉZOUT 
a 


C'est le suivant : 


Démonstration. Dans l’algorithme d’Euclide, on passe d’une 
paire à la suivante en ajoutant des multiples de a et des mul- 


tiples de b. 


ExEMPLE 11.23 - Revenons à l'exemple 11.20, avec a = 77 
et b = 91 ; on a vu que d = pgcd(a,b) = 7. 

Reprenons les divisions euclidiennes que nous avons 
faites, en exprimant systématiquement les restes en fonc- 
tion de a et b. Nous sommes partis de 


91-77x1+14 donc 14=b-a. 
Puis nous avons effectué 
77=14xX5+7 donc 7=a-5(b-a)=6a-5b. 


Enfin la dernière division nous a montré que le pgcd était 
bien d =7. On a donc d = 6a-—5b, ce qui est bien la formule 
annoncée avec u = 6 et v = -5. 


ExEMPLE 11.24 - Cette fois, reprenons l'exemple 11.21. La 
première division était 
B=(X-7)-A+51D, 


avec D = pgcd(A, B) = X? + 2. On a donc bien 
1 1 
= (X- — B, 
D=- PIAF 


qui est la forme annoncée avec U = - (X -7) et V = +. 


voir les exercices 
387, 370 


PREMIERS 
[D-T 


Un nombre ou un polynôme va être appelé premier lors- 
qu’il n’a aucun diviseur à part ceux qui sont évidents. Préci- 
sons : 


DériniTIoN 11.25 - Soit p € Z un nombre + +1. On dit que p est 
premier lorsque la seule façon d'obtenir une factorisation p = ab 
(avec a,b € Z) est de prendre a = +1 ou b = +1. 

Soit P € K[X] un polynôme de degré > 1. On dit que P 
est premier, ou plus souvent irréductible, lorsque la seule fa- 
çon d'obtenir une factorisation P = AB (avec A,B € K[X]) est 
de prendre A constant ou B constant. 


ExEMPLE 11.26 - Un nombre p est donc premier si et seule- 
ment si la liste complète de ses diviseurs est {1,—1,p,-p}. 
Les nombres 17, 71, -277, -733 et 953 sont ainsi pre- 
miers. On adopte souvent la convention de ne parler que 
des nombres premiers positifs, de sorte que leur liste com- 
mence par 2, 3, 5,7,11,13... 


ExeMPLE 11.27 - Un polynôme de degré 1 est toujours irré- 
ductible (premier). Pour un polynôme P € K[X] de degré 2, 
la situation est encore assez simple. Si P = AB et si ni A, 
ni B n’est constant, alors deg A = deg B = 1. Comme un po- 
lynôme de degré 1 possède toujours une racine dans K, 
le polynôme P en possède aussi une. Mais la réciproque 
est vraie : si P(r) = 0, alors en posant A = X -r on peut 
écrire P = AB avec B de degré 1 (proposition 11.6). 

On retiendra qu'un polynôme de K[X] de degré 2 est 
irréductible si et seulement si il ne possède pas de ra- 
cine dans K. Ça reste vrai pour un polynôme de degré 3 
(vérifiez-le). 

Par exemple P = X? + 1 est irréductible dans R[X]. Par 
contre dans C[X] on a P = (X - i)(X + i). 


ProposirioN 11.28 - Un polynôme de C[X] est irréductible si et 
seulement s’il est de degré 1. Un polynôme de R[X] est irréductible 
si et seulement s’il est ou bien de degré 1, ou bien de degré 2 sans 
racine dans R. 


Démonstration. Commençons par C. Les choses sont simples : 
nous venons de remarquer qu'un polynôme de degré 1 est 
toujours irréductible, et réciproquement le corollaire 11.10 
montre qu’un polynôme de degre > 1 peut se factoriser et n’est 
donc pas premier. 

C'est presque la même chose sur R. Dans l'exemple précé- 
dent nous avons montré que les polynômes en question sont 
effectivement irréductibles, et que les polynômes de degré 2 
irréductibles n'ont pas de racine dans R. Ensuite, c’est la pro- 
position 11.12 qui montre que tout polynôme de degré 3 ou 
plus se factorise comme produits de tels polynômes, et donc 
n'est pas irréductible. 


Le théorème de Bézout va permettre de démontrer des 
choses sur les nombres premiers et les polynômes irréductibles 
qui paraissent intuitives, mais qu’on ne saurait pas prouver au- 
trement. Voici le meilleur exemple. 


Lemme 11.29 (Lemme DE Gauss) — Soit P un premier. Si P | AB, 
alors P | A ou P | B. 


Ce résultat est valable pour les entiers comme pour les po- 
lynômes. 


Démonstration. Supposons que P ne divise pas A, et mon- 
trons qu'il divise alors B. Notons que l'on a pgcd(P,A) = 1, et 
donc UA + PV = 1 par Bézout. Par hypothèse on a AB = PR, 
donc UAB = UPR, et comme UA = 1 - PV, on en tire 


(UA)B = B- PVB = UPR. 


Ceci montre que B = P(VB + UR) est bien divisible par P. 


Nous pouvons finalement apporter une réponse à la ques- 
tion soulevée à la fin du chapitre 2 (cf corollaire 2.25) : quand 
est-ce que Z/NZ est un corps? 


ProposirioN 11.30 — Soit p un entier > 2. Alors Z/pZ est un corps 
si et seulement si p est un nombre premier. 


Démonstration. Si p west pas premier, on a p = ab avec a et b 
des nombres qui ne sont pas divisibles par p. En réduisant mo- 
dulo p, on obtient 

ab=p=0, 
avec à + O et b + O. Il est donc impossible que à ait un inverse 
(argumenter comme dans l'exemple 2.27). 

Réciproquement, supposons que p soit premier, et soit a + 0 
un élément de Z/pZ. L'entier a est alors premier avec p, c’est- 
à-dire que pgcd(p,a) = 1 puisque l’on suppose que p ne divise 
pas a. Par Bézout, on a au + pv = 1, et en réduisant modulo p on 
a 


(étant donné que p = 0). C’est donc bien que (a)! = u. Tout 


nombre non-nul de Z/pZ possède un inverse, et on a bien af- 
faire à un corps. 


FACTORISATION 
[P] 


Le théorème suivant généralise le corollaire 11.10 et la pro- 
position 11.12. 


(Lisez la démonstration pour plus de précisions sur ce que 
«de manière unique » signifie.) 


Démonstration. Montrons l'existence de cette écriture, par ré- 
currence sur le degré de P (c’est évident si deg(P) = 0). On peut 
supposer que P est unitaire. Si P est lui-même irréductible, 
alors il n’y a rien à dire. Dans le cas contraire, on écrit P = QR 
avec deg(Q) < deg(P) et également deg(R) < deg(P). Par ré- 
currence on peut factoriser Q et R en produit d’irréductibles, 
donc P aussi. 

Montrons l'unicité (c'est plus fin). On doit donc montrer 
que si on a deux écritures 


AP, Po +++ Pk = pQ1Q2:.-Qr, (*) 


avec chaque P; et chaque Q; unitaire et irréductible, alors À = 
wœ k = €, et les polynômes P; sont les mêmes que les Q;. On 
procède par récurrence sur le degré des deux membres de (*) 
(les choses sont évidentes si le degré est 0). 

Tout d'abord en regardant le coefficient de plus haut degré, 
on voit de suite que À = p. Ensuite, on constate que P, divise 
le produit Q1Q72::: Qp. En conséquence du lemme de Gauss, P, 
doit diviser l'un des Q;, disons Q, pour simplifier les notations. 
Par suite on a P, = Q4, puisqu'il n'y a qu'un seul diviseur uni- 
taire + 1 du polynôme irréductible Q4, à savoir Qı lui-même. 
On simplifie maintenant (*) par ÀP, = AQ; pour obtenir 


P2P3 +- Pk = Q2Q3-:-Qr. (=) 


L'égalité (**) est de degré plus petit que (*), donc par récurrence 
on sait que k = £ et que les polynômes P},..., Py sont les mêmes 
que les polynômes Q:,...,Qy. Ceci termine la démonstration. 


Ce résultat est extrêmement fort. C’est surtout en deuxième 
année que vous en explorerez les conséquences plus sérieuse- 
ment. En attendant, prenez le temps de vérifier la chose sui- 
vante : non seulement le théorème généralise le corollaire 11.10 
et la proposition 11.12 comme nous l’annoncions, mais il dé- 
montre aussi pour K quelconque qu’un polynôme ne possède 
qu’un nombre fini de diviseurs unitaires; plus généralement 
vous pouvez maintenant, pour K quelconque, montrer une ver- 
sion du lemme 11.13 (il faut commencer par définir les « mul- 
tiplicités » mQ(P) pour Q irréductible). 

Par ailleurs, ce théorème existe pour les nombres entiers, es- 
sentiellement avec la même démonstration, et vous le connais- 
sez probablement déjà : 


Chapitre 12 


Matrices 


On rappelle que la lettre K désigne Q, R ou C. 


INTRODUCTION 
[D] 


Une matrice west rien d’autre qu’un tableau de nombres. Si 
l’on s'intéresse mathématiquement aux tableaux, c'est toujours 
de près ou de loin parce qu'ils interviennent dans les systèmes 
linéaires, c'est-à-dire les équations du genre 


Il 
Œ = 


3x = 7y + 9z 
2x + y = 


Ici on pourra associer à ce système la matrice 
3 -7 9 1 
| 2 1 0 3 | | 

Il est clair que toutes les informations concernant le système 
sont contenues dans cette matrice, mais de plus on va voir (et 
vous en avez sans doute eu un aperçu au lycée) que la réso- 
lution du système gagne même en clarté lorsqu'elle est faite à 
partir de manipulations sur la matrice. L’observation-clef que 
nous allons voir tout de suite est que les matrices peuvent être 
multipliées entre elles. Il en résulte des notations simples et 
puissantes. 

Dans les chapitres suivants, nous montrerons que les sys- 
tèmes linéaires, sous des formes plus sophistiquées, sont om- 
niprésents en mathématiques, à un point qui devrait vous sur- 
prendre. Dans ce chapitre le but est simplement de se familia- 


riser avec les matrices, et d'apprendre à résoudre les systèmes. 
Commençons par les définitions. 


Dérinirion 12.1 - Une matrice de type n x m à coefficients 
dans K est un tableau d'éléments de IK comprenant n lignes 
et m colonnes. L'ensemble des matrices n x m est noté M„ „ (K). 
On utilise parfois la notation M,(K) au lieu de M„ „(K), dans le 
cas des matrices « carrées ». 


Par exemple, 


3 -7 9 1 2-3i -4 
| 2 1 0 3 ) M 4050 et | V17 2 emo. 


Les éléments de M, „(K) sont appelés matrices-lignes et ceux 
de M, (K) sont les matrices-colonnes. 

Notez bien la convention suivante. À partir de maintenant, 
nous allons identifier les matrices-colonnes avec les vecteurs 
de K"; c’est-à-dire que l’on identifie IK” et M„ (IK). On se per- 
met donc d'écrire 

xı 


X2 
eK”. 


Xn 


On fait ce choix particulier dans le but de simplifier (énor- 
mément) certaines formules qui vont apparaître dans la suite. 
Dans d’autres chapitres de ce livre, vous l'avez sans doute déjà 
remarqué, les éléments de K" sont notés (x1,...,X„), donc en 
ligne : il faut voir ça comme une notation que l’on s’autorise dès 
qu'il n’y a pas d’ambiguiïté, dans le but d'économiser la place. 
Mais dès lors qu’il y a des matrices en vue, et des opérations 
sur ces matrices, les vecteurs sont des colonnes. 
On utilise parfois la notation 


(aij) 1<i<n 

1<j<m 
ou plus simplement (a;;);,; lorsque n et m sont entendus, pour 
désigner la matrice de M,,,,(K) donc le coefficient sur la ligne i, 


dans la colonne j, est le nombre a;;. Par exemple dans le cas de 
matrices 2 x 3, la matrice (a;;);,; est 


411 412 413 
431 422 423 
Autre exemple, avec des matrices 3 x 3, la « matrice donnée 


par (cos(i) sin(j)); ; » est 


cos(1)sin(1) cos(1)sin(2) cos(1)sin(3) 
cos(2)sin(1) cos(2)sin(2) cos(2)sin(3) 
cos(3)sin(1) cos(3)sin(2) cos(3)sin(3) 


DÉFINITION 12.2 — Si A = (a;;);,; est une matrice n x m, alors sa 
transposée est la matrice A, de type m x n, donnée par 


(Noter l'inversion de i et de j : sur la ligne i dans la colonne j, 
on trouve cette fois 4;;.) 


Par exemple si A est la matrice 2 x 3 ci-dessus, alors 


A 411 421 
A=| 4j2 42 
413 423 


Si B est la matrice 3 x 3 ci-dessus, alors 


cos(1)sin(1) cos(2}sin(1) cos(3)sin(1) 
'B=| cos(1)sin(2) cos(2)sin(2) cos(3)sin(2) 
cos(1)sin(3) cos(2})sin(3) cos(3)sin(3) 


La transposée d’une matrice-ligne est une matrice-colonne, et 
vice-versa. 


ADDITION ET MULTIPLICATION 
bu] 


Pour commencer, on peut additionner deux matrices de 
même type « coefficient par coefficient » : par exemple 


1 2 3 1 1 1\ (23 4 
4 5 6 /*\-1 a -1 J/-| 3 4 5 |` 
(En d'autres termes (aij)ij + (bij)ij = (aij + b;;);,;.) 
On peut aussi multiplier une matrice par un «scalaire », 


c'est-à-dire un élément de K, en multipliant tous les coeffi- 
cients par ce nombre : par exemple 


sdi 3\_[ 2 ë 
9 27 | | 18 54 |’ 
(En d’autres termes M4;j)i,j = (A4;j)i,j.) 


Multiplier deux matrices entre elles est plus compliqué. 
Commençons par un cas simple. 


DériniTION 12.3 - Donnons-nous une matrice-ligne de type 1 x 
m, disons 
XZ a az => Am ); 


prenons également une matrice-colonne de type m x 1, disons 
bi 
b2 


bm 
Alors le produit AB est par définition la matrice 1 x 1 dont 
l'unique coefficient est 
a bi +a2b2+ cor Ed Dr: 


(Si le nombre de coefficients de A n'était pas égal au nombre de 
coefficients de B, le produit AB ne serait pas défini.) 


Par exemple 
z 
(4 -1 10 ] 0 É 4x(-1)+(-1)x0+10x1 )=( 6 ); 


ou encore (2 -3 )-( Z )=( 2x-39 ); 


On va identifier, chaque fois que c'est commode, les ma- 
trices 1 x 1 et les éléments de K. Ceci étant, dans le cas général, 
on définit la multiplication de la manière suivante. 


DÉFINITION 12.4 — Soit A une matrice n x m, et soit B une ma- 
trice m x p. Alors le produit AB est la matrice n x p dont le 
coefficient sur la ligne i, dans la colonne j, est le produit de la 
ligne i de A par la colonne j de B. 


ExEMPLE 12.5 - Admettons que l'on souhaite multiplier 


1 -4 
1 2 


-3 -14 -5 1 
8=( 1 0 -19 E! 


Le produit est bien défini puisque le nombre de colonnes 
de A est égal au nombre de lignes de B. Le produit AB va 
avoir autant de lignes que A et autant de colonnes que B; 
ce sera donc une matrice 3 x 4. 

Pour faire le calcul, il est utile de présenter les choses 
comme ci-dessous. 


Pour calculer, par exemple, le coefficient sur la pre- 
mière ligne, dans la colonne 3, du produit AB, on regarde 
la ligne et la colonne correspondantes. Ensuite on les mul- 
tiplie par la méthode déjà donnée, donc ici 


(1 -4 2 )=( 1x(-5)+(-4x(-19) )=( 71 ). 


On procède de même pour tous les autres coefficients. 
Après un certain temps, le calcul terminé ressemble à ceci : 


-3 -14 -5 1 

1 0 -19 -7 
1 -4 -7 -14 71 29 
1 2 1 14 -43 -13 
-1 1 4 14 -14 -8 


La matrice en bas à droite est AB. 


ExEMPLE 12.6 — Voyons comment la multiplication des 
matrices permet d'écrire les systèmes. Considérons par 
exemple 


| 
= 


2x + 6y = =9 
—4x + 3y 


Posons alors 


EEDE 


On calcule facilement que 


ax =| 2x + 6y | 


-4x + 3y 


Ainsi le système de départ est équivalent à une seule éga- 
lité de matrices-colonnes, à savoir : 


AX =B. 


Cette notation très compacte fait ressortir le plus impor- 
tant : on a bien envie de « diviser par A » des deux côtés, 
puisqu'on cherche X. Nous allons voir rapidement si oui 
ou non on peut donner un sens précis à cette intuition. 


Il faut s’habituer à multiplier les matrices relativement vite 
et sans se tromper. 


voir les exercices 
1040, 1041, 
1042, 1043 


RÈGLES DE CALCUL 
[D] 


Il y a deux matrices qui jouent des rôles particuliers dans 
les opérations arithmétiques. Tout d’abord la matrice dont tous 
les coefficients sont nuls : on la note simplement 0, quelle que 
soit sa taille. Dans le cas des matrices carrées de taille n, on a 
également la matrice « identité » ci-dessous : 


0 
1 


=> © Oo = 
rm © => © 


0 
0 
On la note Id, ou Id ou encore I. 


Proposition 12.7 - Les règles de calcul suivantes sont valables 
dans M, (K) : 


(a) A+B=B+A, (e) A(B+C) = AB+ AC 
(b) 0 +A =A, et (A +B)C = AC + BC, 
(c) (A+B)+C=A+(B+C), (f) Id A = Ald =A, 


(d) VA 3(-A) tel que A+(—-A)=0, (g) (AB)C = A(BC). 

(En d'autres termes, M,(K) est un anneau, les rôles de O et 1 
étant joués par les matrices nulle et identité. Cet anneau n'est pas 
commutatif.) 

De plus l'opération de multiplication par un scalaire vérifie 


À: A=(X:Id)A = A(À- Id). 


La démonstration est facile et vous est laissée à titre d’exer- 
cice. Par exemple examinez bien l'égalité Id A = AId = A. C’est 
à cause de cette règle que l’on écrit parfois 1 pour la matrice 
identité. 

Cet énoncé signifie que les règles de calcul habituelles s’ap- 
pliquent aux matrices, sauf les deux suivantes. D'abord la com- 
mutativité : on n'a pas toujours AB = BA, par exemple pour 


0 3 =d. =i 
asfi E: = B=| 2 x | 


($ 3) œ m1 3) 


on a 


0 2 1 7 


L'autre chose à laquelle il faut s'habituer, c’est qu'on ne peut 
pas toujours obtenir « l'inverse » d’une matrice. En d’autres 
termes, étant donnée A, il n'existe pas toujours de matrice A! 
telle que AA-! = Id, même si A + 0 (rappelons que le rôle de 1 
est joué par Id !). En effet il suffit de prendre 


1 0 
asf o); 
il est clair qu’un produit AB donne toujours une matrice dont 
la deuxième ligne est nulle, donc on n’obtiendra jamais l’iden- 


tité. Ce phénomène est très important pour la suite, donc 
soyons plus précis. 


DÉFINITION 12.8 (Er Proposirion) — Soit A € M,(K). On dit 
que A est inversible lorsqu'il existe une matrice B € M,(K) telle 
que 

AB=Id et BA=ld. 


Une telle matrice B, lorsqu'elle existe, est unique. On la 
note A`! et on l'appelle l'inverse de A. 


Démonstration. Nous devons montrer l’unicité de B. Suppo- 
sons donc que AB = BA = Id d’une part, et AC = CA = Id 
d'autre part. En multipliant AB = Id par C à gauche, on obtient 


C(AB) = (CA)B=IdB=B=CId =C. 


On a donc bien B =C. 


On vient de voir un exemple de matrice non-inversible. 
Dans le cas des matrices 2 x 2, on peut décrire les matrices in- 
versibles très facilement : 


a b 
À = | € à | ; 
Alors A est inversible si et seulement si ad — bc + 0. Dans ce cas 
l'inverse est donnée par 


_ Ï d -b 
à -li a |` 


La quantité ad - bc s'appelle le déterminant de A. Dans le 
chapitre du même nom, nous verrons comment étendre ceci 
aux matrices n x n. 


ProPosirTioN 12.9 — Soit 


Démonstration. Soit 


Alors 


~ ad — bc 0 
ak =| 0 ad-bc | 


Si ad — bc = 0, alors AÂ = 0. Dans ce cas la matrice A ne peut 
pas être inversible : si elle l'était, on aurait AAA = À = 0, 
donc a = b = c = d = 0, donc A = 0, et donc AA ! = 0 = Id, 
contradiction ! 

Supposons maintenant que ad — bc + 0. On a 


AÂ = (ad - bc)ld, 


donc en multipliant par le scalaire - T =, on obtient 


^la Á) = Ld. 


De la même manière, vous vérifierez que dans l'autre sens on a 
aussi 


ad — bc 


donc l'inverse de A existe et c’est bien À, comme annoncé 
dans la proposition. 


1 z 
( â)A = Id, 
voir l'exercice 
1045 


ExEMPLE 12.10 - Revenons à l'exemple 12.6. On y trouvait 
la matrice 
2 6 

kz ( La | | 
Son déterminant est 2 x 3 +4 x 6 = 30, donc A est inversible 
et í i 

z ho 75 

A! = . 
( hs Vis 


Le système étudié était AX = B, et nous pouvons mainte- 
nant multiplier par A-! pour obtenir 


—11 
A '(AX)=(A'A)X =IdX=X=A-!B a) 
15 


Qaan 


En d'autres termes x = -!1⁄4 q et y = 17⁄4 5. 


MATRICES ÉCHELONNÉES 
[EEE => ccc 


DÉFINITION 12.11 - Soit A une matrice. On dit que A est éche- 
lonnée, ou parfois échelonnée en lignes, lorsque les trois condi- 
tions suivantes sont satisfaites : 


1. Dans chaque ligne de A, le premier coefficient non-nul 
(en partant de la gauche) est un 1. On l'appelle le pivot de 
la ligne. 


2. À mesure que l'on descend dans les lignes, les pivots se 
décalent vers la droite. 


3. Les lignes nulles de A sont situées en-dessous des lignes 
non-nulles. 


De plus, on dit que A est bien échelonnée lorsqu'elle est éche- 
lonnée et que les pivots sont les seuls coefficients non-nuls dans 
leur colonne. 


ExEMPLE 12.12 -Les matrices suivantes sont échelonnées 
(les pivots sont encadrés) : 


somol (HA) 
0 0 0 0 De 


La première est bien échelonnée, mais pas la deuxième (il 
faudrait que le 2 soit un 0). 

Les matrices A; ci-dessous ne sont pas échelonnées, car 
elles violent les règles 1, 2, 3 respectivement : 


2 0 0 T 1 1 1 
A=|0 5 1 |, ~= Í A A3=|0 0 0 
0 0 0 0 1 10 


Pourquoi prêter attention aux matrices (bien) échelonnées ? 
Tout simplement parce que les systèmes linéaires correspon- 
dants sont les plus simples possibles, en fait leurs solutions 
sont données sur un plateau. 


ExEMPLE 12.13 - Prenons la matrice suivante, qui est bien 
échelonnée : 


1| 4 —3 
A= 0 0 11 0 
0 0 0 0 


Elle a quatre colonnes, elle peut donc décrire un système à 
quatre inconnues sur le modèle de l'exemple 12.6. En clair, 
posons 


$ 4 
X= A et, par exemple, B=| 2 |, 
| 0 
alors le système AX = B s'écrit 
x| + 4y - 3t = 4 
Z = 2 
0 = 0 


Ici les inconnues x et z sont encore appelées « pivots », on 
les a d’ailleurs encadrées. La matrice étant bien échelon- 
née, les solutions sont sous nos yeux : 
+ les inconnues qui ne sont pas des pivots vont servir 
de paramètres, 
o les pivots vont être exprimés en fonction de ces pa- 
ramètres. 
Les paramètres sont donc y et t, et on a z=2etx=4-4y+ 
3t. En d’autres termes l’ensemble des solutions est 


4— 4y +3t 
4 avec y, t E K cK“. 


2 
t 


Il est souvent plus lisible d'écrire cet ensemble sous la 
forme suivante : 


4 -4 


avec y, te K 


o No 
rá OOo 


1 
+91 q [+f 
0 


Cette méthode aurait fonctionné tout aussi bien pour 
n'importe quel second membre B, sauf dans les cas oà c'est 
encore plus facile. Imaginons en effet que le dernier coeffi- 
cient de B ne soit pas nul, disons 


1 
B=| 1 |, 
1 
alors le système devient 
x| + 4y — 3 = 1 
Z = Ï 


0 = 1 


L'équation 0 = 1 étant impossible à satisfaire, le système 
n'a pas de solution du tout. 

On vient de voir un système avec une infinité de solu- 
tions, puis un système sans solution. Sans changer la ma- 
trice A, il est clair que l'on tombe dans l'une ou l'autre de 
ces situations, selon le second membre B. 

Mais il existe aussi des systèmes possédant une solution 
unique, par exemple avec 


(3 3) (3) R) 


alors le système Æ’ X = B s'écrit 


Re =. 


i 


y = b 


On a donc y = b; et x = bı +9y = bı +9b2. Notez bien qu'ici 
la matrice A’ est échelonnée mais pas bien échelonnée (à 
cause du -9), et on a réussi à résoudre le système quand 
même. Ceci dit, on a dû faire une substitution supplémen- 
taire (insérer la valeur de y dans x). 

Il est clair que si un système AX = B avec A bien éche- 
lonnée n’a pas une infinité de solutions (donc pas de para- 
mètres), alors il y a un pivot dans chaque colonne ; la ma- 
trice A ressemble donc à la matrice identité à laquelle on a 
rajouté des lignes de zéros. Ainsi, selon B, on a soit une so- 
lution unique (si les dernières équations sont toutes O = 0), 
soit aucune (s’il y en a une du type 0 = 1 comme ci-dessus). 

En particulier, avec une matrice bien échelonnée, on 
n'obtient jamais de système ayant, disons, six solutions. On 
va voir que toutes ces observations faites sur les matrices 
échelonnées se généralisent aux matrices quelconques. 


OPÉRATIONS SUR LES LIGNES 


Puisqu'il est si facile de résoudre les systèmes correspon- 
dant aux matrices échelonnées, on aimerait pouvoir se ramener 
toujours à ce cas. C’est effectivement possible. 


DérinirIon 12.14 - Nous allons nous autoriser trois types 
d'opérations sur les lignes d’une matrice : 


1. multiplier une ligne par un scalaire non-nul, 
2. permuter deux lignes, 


3. ajouter à une ligne un multiple d’une autre ligne. 


ExEMPLE 12.15 - Prenons la matrice 


1 -1 -2 0 
3 1 1 —1 |, 


et faisons quelques opérations. Retranchons la première 
ligne à la dernière ligne (opération de type (3)) : 


1 -1 -2 0 
3 1 1 —1 Le L; - Lı 
0 2 1 5 


On a noté L; = L3-L; pour indiquer l'opération effectuée ; 
d’autres abréviations sont possibles mais en tout cas il est 
bon d'indiquer au lecteur comment on a obtenu la nouvelle 
matrice. Poursuivons par une autre opération de type (3) : 


0 4 7 -1 ie L2=3L; 


1 -1 -2 0 
0 1 y, 3⁄9 Lo < L3 
0 4 7 -1 


Essayons d'obtenir une matrice aussi simple que possible. 
Et d'abord, débarrassons-nous de ce 4: 


Ï ST `=2 0 
0 1 1⁄2 32 L; = L; — 4L3 
0 0 5 -11 


1 5 1 
0 111 1⁄2 / L; = 513 
D à [1] y 


C'est déjà une matrice échelonnée. On peut même pour- 
suivre notre effort et obtenir une matrice bien échelonnée : 


1 
0 1 0 18⁄2 Lze Lz- zl 


1 0 13% Lie L + 2L; 


et enfin 


0 [11 o 13% Lı =L; +L 


THÉORÈME 12.16 - En faisant des opérations sur les lignes d’une 
matrice À, on peut toujours obtenir une matrice bien échelonnée, 
et une seule. 


On notera E; la matrice bien échelonnée associée à A. 

L’unicité de la matrice E4 sera démontrée dans la deuxième 
moitié de ce chapitre. Pour l'existence, il suffit de procéder 
comme dans l'exemple 12.15. On peut garder en tête les lignes 
directrices suivantes : 

© On choisit une ligne avec un coefficient non-nul dans la 
première colonne, on met cette ligne en première posi- 
tion, puis avec des opérations de type (3) on fait appa- 
raître des 0 dans la première colonne sur les autres lignes. 
On divise la première ligne par son premier coefficient 
pour que celui-ci devienne un 1. 

© On oublie la première colonne et la première ligne com- 
plètement, et on continue avec le reste de la matrice. On 
obtient alors une matrice échelonnée. 

+ Pour obtenir une matrice bien échelonnée, on commence 
par le dernier pivot. Avec des opérations de type (3), on 
fait apparaître des O au-dessus de ce pivot. Puis on re- 
commence avec les pivots précédents. 

Ou alors, relisez l'exemple 12.15 soigneusement. 

Toutes ces considérations n'auraient pas un grand intérêt 
vis-à-vis des systèmes si l’on n'avait pas le résultat suivant, qui 
affirme que les opérations sur les lignes ne changent pas les 
solutions : 


PropPosirioN 12.17 — Considérons un système de la forme AX = B, 
où X et B sont des colonnes, et X contient les inconnues. 

Soit A’ obtenue à partir de A en faisant des opérations sur les 
lignes, et soit B' obtenue en faisant les mêmes opérations sur B. 
Alors le système A' X = B’ a les mêmes solutions que AX = B. 


Là encore, la démonstration sera donnée plus loin dans ce 
chapitre (elle n’est pas difficile). 


ExEMPLE 12.18 — Considérons le système 


X = y -_ 2z = 0 
3x + Y + Z =] 
X + y - z= 5 


Il est de la forme AX = B en posant 


1 -1 -2 x 0 
À = 3 1 1 S X= y 3 B= —] 
1 1 -1 Z 5 


D'après la proposition, on ne change pas les solutions en 
faisant des opérations sur A et B en même temps. Il s'agit 
de faire les mêmes opérations sur ces deux matrices, et 
en pratique de nombreux étudiants préfèrent ajouter B 
comme colonne à A, de sorte que l'on fait des opérations 
sur la matrice 


1 -1 -2| 0 
3 1 1 | -1 
1 1 =Ï 5 


(La ligne verticale est juste là pour rappeler d’où vient la 
dernière colonne.) C'est la matrice sur laquelle nous avons 
travaillé dans l'exemple 12.15. Nous avons vu qu'après 
quelques opérations, on arrive à 


11 o o0] # 
1 0 18 5 
0/0 [11] 1⁄4 


En faisant la traduction inverse, on retrouve un système, 
qui est particulièrement simple : 


x = Ys 
z = 1⁄2 


Ces trois valeurs de x, y et z constituent l'unique solution 
du système initial AX = B, comme vous pouvez le vérifier. 


exercice : mettez 
sous forme 
échelonnée 
toutes les 
matrices des 
exercices 


précédents 


voir les exercices 
Ti 4173 


CALCUL DE L'INVERSE D'UNE MATRICE 
EE 


Nous allons donner une méthode pour calculer l'inverse 
d’une matrice quand elle existe (ou démontrer que l'inverse 
n'existe pas lorsque c'est le cas). Nous ne dirons rien de la dé- 
monstration ici : c'est encore un résultat établi plus loin dans 
ce chapitre. 

La méthode va paraître un peu magique. Donnons simple- 
ment l'indication suivante : nous venons d'expliquer comment 
résoudre les systèmes linéaires en faisant des opérations sur les 
lignes, alors que dans l’exemple 12.10 nous indiquions com- 
ment résoudre un système si l’on connaît l'inverse de sa ma- 
trice. C’est en comparant ces deux méthodes, qui doivent bien 
donner le même résultat, qu'on en déduit la méthode de calcul. 
Voici le principe. 


abus fréquent : 
«inverse » au 
féminin comme 
raccourci de « la 


matrice inverse » 


PropPosirioN 12.19 — Soit A € M,(K). Alors : 
1. A est inversible si et seulement si sa matrice bien échelon- 
née Ea est l'identité. 
2. Étant donnée une suite d'opérations sur les lignes qui trans- 
forment A en E; = Id, on obtient A`! en faisant les mêmes 
opérations (dans le même ordre) sur la matrice identité. 


EXEMPLE 12.20 - Voyons comment mettre ceci en pratique. 
Admettons que l’on s'intéresse à l'inverse de la matrice 


-1 1 -1 
A= 0 -1 1 
1 2 3 


On va faire des opérations sur les lignes de A pour trouver 
sa forme bien échelonnée, et chaque opération est faite en 
parallèle sur la matrice identité. On commence donc par 
présenter les matrices côte à côte : 


—1 1 -1 1 0 0 
0 -1 1 0 1 0 
1 2 3 0 0 1 
On commence : 
—1 1 -1 1 0 
0 -1 À 0 1 0 bebe 
0 3 2 1 1 
-1 — 1 0 0 
0 — 0 1 0 L; = L; + 3L, 
0 1; 3: Ü 
1 -1 1 -1 0 0 L, «€ -L4 
0 1 —1 0 —] 0 L> E= —L; 
0 0 1 4⁄5 3⁄5 15) Lil 
_ -6 -3 =j 
Ne 75 75 fs Lz = L2+L3 
0 1 0 /5 75 75 LZ T 2 T 
0 0 1 Ys 3⁄4 Ys 1 1 3 
1 0 0 -1 -1 0 
010 Ys 3 Vs L, =L +L2 
0 0 1 Vs 3⁄5 Vs 


On a obtenu une matrice bien échelonnée, c'est donc E4. Ici 
on a E; = Id, donc A est inversible d’après la proposition. 
Cette même proposition affirme aussi que la matrice A~! 
est la dernière matrice écrite à droite, c’est-à-dire 


-1 -1 0 
Al = Y; =Y Y; 
Yy; Yz Y; 


Prenons un autre exemple, disons 


ï Z =l 
B=| -6 16 -2 
-11 6 3 
C'est reparti : 
1 2 -1 1 0 0 
0 28 -8 6 À 0 La #6 
Lz — L3+11L 
0 28 -8 11 0 1 à 2 l 
1 2 -1 1 0 0 
0 28 —8 6 1 0 L; — L; - Lz 
0 0 0 5 -1 1 


Arrêtons-nous : on vient d'obtenir une ligne de zéros. En 
effet, si l'on poursuivait le calcul on obtiendrait une ma- 
trice bien échelonnée qui elle-même aurait une ligne de zé- 
ros, donc Ep + Id. D’après la proposition, la matrice B n'est 
pas inversible. Les calculs que l’on a faits sur la matrice 
identité n'auront servi à rien : c'est l’un des petits défauts 


de la méthode. 
voir les exercices 


2750,2775, 
2773 


- Fin de la première lecture - 


UN AUTRE POINT DE VUE SUR LES OPÉRATIONS 


L'observation suivante est riche de conséquences : faire une 
opération sur les lignes revient à multiplier à gauche par une 
matrice inversible. Plus précisément : 


ProPosirioN 12.21 — Soient À une matrice, et A’ obtenue en fai- 
sant une opération sur les lignes de A. Alors il existe une matrice 
inversible P telle que A’ = PA. 

De plus, pour chaque type d'opération on peut trouver une ma- 
trice P unique qui convient pour toutes les matrices A à la fois. 


Démonstration. Cherchons P qui convient pour toutes les ma- 
trices A. On n'a pas beaucoup de choix, puisqu'’en faisant A = 
Id, on a A’ = PId = P : en d’autres termes, la matrice P elle- 
même doit être obtenue en faisant l'opération en question sur 
les lignes de la matrice identité. 

Par exemple, pour multiplier la première ligne par À + 0, on 
doit prendre 


À 0 0 
0 1 0 
P=Mi=| 0 0 1 
0 0 0 


Or on vérifie que pour toute matrice A, le produit M.A est ef- 
fectivement obtenu en multipliant la première ligne de A par À. 
De plus M, est bien inversible, d’inverse M;-1. Donc la propo- 
sition est vraie pour cette opération. Pour multiplier une autre 
ligne, déplacer À le long de la diagonale. 

Pour permuter la première ligne et la deuxième, on doit 
prendre 


0 1 0 0 
1 0 0 0 
p-| 0 0 1 0 
0 0 0 1 
0 0 0 0 


On vérifie que cette matrice convient effectivement. Elle est in- 
versible, et même égale à on inverse. 
Pour ajouter À fois la deuxième ligne à la première, prendre 


r= © © 


Pacs 


o oore 
o o» >» 


© 


Cette matrice convient, et son inverse est Cr. 
Les autres cas sont similaires. 


COROLLAIRE 12.22 — Pour chaque matrice A, il existe une ma- 
trice P inversible telle que EÍ = PA. 


Attention, cette matrice P dépend de A fortement ! 


Démonstration. On peut obtenir EA en faisant des opérations 
sur les lignes de A; disons que cela nécessite k étapes. Si la 
première opération correspond à la matrice P}, alors après une 
étape on travaille avec P, A. Si la deuxième opération est don- 
née par P,, on se retrouve avec P)P}A. Après k opérations, on 
a PPy_1 Pi A = Ej. La matrice P = P;P4_1---P, est inversible 
et son inverse est P P Prt. 


On peut maintenant démontrer très facilement la proposi- 
tion 12.17 : 


Démonstration de la proposition 12.17 . Pour toute matrice in- 
versible P, on a 


AX=B <= PAX=PB, 


puisqu'on passe de l'égalité de gauche à celle de droite en mul- 
tipliant par P, et dans l’autre sens en multipliant par P-!. Or 
faire des opérations sur les lignes revient bien à multiplier par 
une matrice inversible. 


JUSTIFICATION DE LA MÉTHODE DE CALCUL DE L'INVERSE 
e—a] 


Commençons par un petit lemme utile. 


Lemme 12.23 — Soient A et B deux matrices carrées telles que 
AB=Id. 


Alors A et B sont toutes les deux inversibles, et inverses l’une de 
l’autre. 


Rappelez-vous que dans la définition 12.8, on donnait deux 
conditions à vérifier : AB = Id et également BA = Id. Donc ce 
résultat affirme qu’une seule de ces conditions entraîne l’autre. 


Démonstration. Soit P inversible telle que PA = E4. On a donc 
PAB = EAB = PId =P. 


En particulier la matrice EAB = P est inversible. On en conclut 
qu’il ne peut pas y avoir de lignes nulles dans E4, sinon il en 
serait de même dans E4B, et cette matrice ne pourrait pas être 
inversible. 

Puisque E, est bien échelonnée sans lignes nulles, et car- 
rée, on doit avoir Ea = Id. Ainsi E4B = Id B = B = P, et B est 
inversible. En multipliant AB = Id par B-! à droite, on ob- 
tient A = B~}, donc A est inversible également, et c'est l'inverse 
de B. 


Démonstration de la propositon 12.19. Si A est inversible, on a 
E; = Id comme on vient de le voir dans la démonstration du 
lemme. Réciproquement si Ej = Id, alors on prend P inversible 
telle que PA = Ej = Id. D'après le lemme A est inversible et 
son inverse est A7! = P. Ceci établit déjà le (1) de la proposi- 
tion 12.19. 

Puisque P = A-!, on a PId = A-!. Or multiplier à gauche 
par P revient à faire des opération sur les lignes, et on constate 
bien que A! s'obtient en faisant sur la matrice identité les 
mêmes opérations que l’on a faites sur A. C’est ce que dit le 
(2) de la proposition. 


L'UNICITÉ DE LA MATRICE BIEN ÉCHELONNÉE 
y 


ProposirioN 12.24 — Soient E, et E, des matrices bien échelonnées 
de même taille. On suppose qu'il existe une matrice P inversible 
telle que E, = PE;. Alors E, = F3. 


Démonstration. Si E, = 0, alors E; = 0 = E;, donc on envisage 
la situation où E, # 0. Supposons que E, commence par k co- 
lonnes nulles (avec éventuellement k = 0). La k+1-ème colonne 


est donc 
1 


0 


0 
puisque E, est bien échelonnée. En conséquence la matrice PE, 
commence également par k colonnes de 0, et sa (k + 1)-ème 


colonne est la première colonne de P. Mais PE, = E; est bien 
échelonnée, donc cette colonne de P est elle aussi de la forme 


1 
0 
0 


On voit donc déjà que E, et E} sont identiques dans les k+ 1 
premières colonnes. Plus précisément on écrit 


0 +++ 0 1 CE: 
E;=| 0 + 0 0 E 

. T" i 

0- 0 0 


pour i = 1 ou 2. On observe que la matrice F; est bien échelon- 
née. De même on note 


1 a; 43 °° An 


Cette matrice P’ est inversible ; en fait, P étant une matrice nxn, 
alors l'inverse de P’ est le bloc (n — 1) x (n - 1) en bas à droite 
de P-!. 

À partir de l'égalité E, = PE,, on tire facilement F = P’ F}. 
Faisons une récurrence sur le nombre de lignes des matrices (le 
cas des matrices-lignes vient d'être traité en silence, puisqu'on 
a établi que P = [1] dans cette situation). Comme F; est stric- 
tement plus petite que E;, on peut supposer que l'on connait 
la proposition dans ce cas, et donc que F; = Fz. Reste à mon- 
trer que E, et E, ont la même première ligne, sachant que la 
première ligne de E, = PE, est 


Lı +aL)+...+a,L, (*) 


où L; est la i-ème ligne de E4. 

Si E a un pivot dans la ligne í > 1, alors E} aussi puisque 
F, = PB. Un pivot étant seul dans sa colonne, on constate que, 
dans la même colonne de PE}, on trouve a; sur la première 
ligne. Puisque PE; = E, est bien échelonnée avec un pivot dans 
cette colonne, on doit avoir a; = 0 dans ce cas, donc 4;L; = 0. 

Si par contre la ligne L; de E, n’a pas de pivot, c’est qu’elle 
est nulle. On a encore a;L; = 0. 

Finalement, l'expression (*) montre clairement que la pre- 
mière ligne de E, = PE, est L4, qui est aussi la première ligne 
de E;, comme on le souhaitait. 


Démonstration du théorème 12.16. Si E, et E sont deux ma- 
trices bien échelonnées obtenues à partir de A, alors il existe 
des matrices inversibles P, et P, telles que P| A = E, et P.A = E} 
(proposition 12.21). Ainsi E} = PP, TE, donc la proposition 
précédente montre que E, = E;. La matrice échelonnée asso- 
ciée à A est bien unique. 


Chapitre 13 


Déterminants 


On rappelle que la lettre K désigne Q, R ou C. 


MÉTHODE DE CALCUL 
(borc 


L'objectif de ce chapitre est de montrer une généralisation 
de la proposition 12.9. Plus précisément, on cherche à associer 
à toute matrice carrée un nombre, son déterminant, qui soit fa- 
cilement calculable et qui permette de décider si la matrice est 
inversible ou non. On aimerait aussi avoir une formule pour 
l'inverse (bien que l'on sache déjà calculer les inverses efficace- 
ment). 

C'est dans la deuxième partie de ce chapitre que nous mon- 
trerons le théorème suivant : 


THÉORÈME 13.1 — Il existe une unique fonction 


det: M„(K) => K 
A H> det(A) 


ayant les propriétés suivantes : 


1. Si A, est obtenue à partir de A en multipliant une ligne 
par à € K, alors det(A,) = A det(A). 


2. Si A, est obtenue à partir de A en échangeant deux lignes, 
alors det(A2) =-det(A). 

3. Si A3 est obtenue à partir de A en ajoutant à une ligne un 
multiple d'une autre ligne, alors det(A3) = det(A). 


4. det(Id) =1. 


De plus, pour toute matrice A, on a det(A) = det(+ A). Par suite, on 
peut remplacer « ligne » par « colonne » dans ce qui précède. 

Enfin, si |$: M,(K) > K est une fonction ayant les proprié- 
tés (1), (2) et (3) ci-dessus (mais pas forcément (4)), alors il existe 
un nombre a € K tel que b(A) = adet(A). 


C'est tout ce que nous avons besoin de savoir sur cette fonc- 
tion, et le fait de rejeter la définition du déterminant à plus 
tard ne va nous empêcher ni de les calculer, ni de montrer leur 
utilité. 

Commençons par quelques calculs. Ensuite nous montre- 
rons que les déterminants ont bien quelque chose à voir avec 
les inverses. 


ExEMPLE 13.2 - Pour les matrices 2 x 2, la fonction que l’on 
a déjà vue 
a b 
| c d | + ad — bc 


vérifie les quatre conditions : vérifiez-le ! Donc par unicité, 
c'est bien la fonction déterminant : 


a b 
det| X | =ad-bc. 
ExEMPLE 13.3 - Prenons 
2 2 2 
M=| -3 3 -3 |, 
1 1. 21 
220 D 2 


et calculons det(M). On va utiliser les propriétés ci-dessus 
pour se ramener à une matrice échelonnée, comme nous 
savons le faire. 

D'abord une notation : on va écrire 


D. 2 2 2 2 2 
-3 3 -3 |=det| -3 3 -3 
1 1 _L I 1 T 
2 2 77 2 2 T2 


La propriété (1) est souvent interprétée « à l'envers » 
par les étudiants, au début. Il s'agit bien de la chose sui- 
vante : la matrice M est obtenue en multipliant par 2 la 
première ligne de 


1 1 1 
N=| =3 3 =3 
1 1 _1 
2 2 2 


On a donc det(M) = 2det(N). La règle est simple : on 
« sort » le 2 du déterminant. On va écrire les choses comme 
ceci (on continue avec les autres lignes) : 


2 2 2 1 1 1 
—3 3 -3 |=2| -3 3 =3 
1 L Tock al 
2 2 2 2 2 2 
1 1 1 1 1 1 1 
=2x3| -1 1 -1 FRANS -1 1 -1 
1 1 1 
7 2 73 1 1 -1 


1 1 1 1 1 1 
-1 1 -11=| 0 2 0 Le L + Li. 
1 1 -1 1 1 -1 


1 1 1 1 1 1 
0 2 0 =| 0 2 0 L; < L3-L4. 
1 1 -1 0 0 -2 


Avec l'habitude, vous verrez immédiatement que ce der- 
nier déterminant vaut —4. Pourquoi ? Voyons : 


Li À 111 
0 2 o0ļ=2x(-2|0 1 0 
0 0 -2 0 0 1 


1 1 0 1 0 
=-4|[ 0 1.0 1=-4/| 0 0 
0 0 1 0 1 


C =C 


Pour les deux dernières égalités, on a fait successivement 
les opérations L, = L, -L3 puis Li = Li - Lo. 

Le déterminant de la matrice identité vaut 1 d'après le théo- 
rème, donc 


L 1 1 
0 2 01=+-4, 
0 0 -2 


comme annoncé. Quant au déterminant de M, il vaut finale- 
ment 1 
det(M) =2x 3 x 5 x (—4) =>12. 


ExEMPLE 13.4 - Avec des opérations sur les lignes, on peut 
toujours se ramener au calcul du déterminant d'une ma- 
trice bien échelonnée. Que dire s'il ne s'agit pas de l'iden- 
tité? Que vaut par exemple det(A) lorsque 


1 0 0 
A=| 0 1 0 ? 
0 0 0 
C'est bien simple : en multipliant la troisième ligne de A 
par 0, on obtient encore la matrice A. Donc det(A) = 0 x 


det(A) = 0. Le déterminant d'une matrice ayant une ligne 
nulle est nul. Et pareil avec les colonnes. 


Le résultat suivant est alors facile : 


ProposirionN 13.5 - Une matrice carrée est inversible si et seule- 
ment si son déterminant est non-nul. 


Démonstration. Si A’ est obtenue à partir de A en faisant une 
opération sur les lignes, on a det(A’) = 0 & det(A) # 0 (on 
se rappellera que les opérations « autorisées » pour échelonner 
une matrice, données dans la définition 12.14, comprennent la 
multiplication d’une ligne par un scalaire non-nul). Si Ea dé- 
signe comme d’habitude la matrice bien échelonnée associée 
à À, on constate que det(A) + 0 si et seulement si det(E1) # 0. 

De plus, pour une matrice bien échelonnée telle que E4, on 
constate que son déterminant vaut 0 s’il y a une ligne nulle, 
et 1 sinon, puisque le seul cas dans lequel il n’y a pas de ligne 
nulle dans E4 se produit pour E4 = Id. 

Pour finir on sait que A est inversible si et seulement si E4 = 
Id (proposition 12.19), donc si et seulement si det(EA) = 1, ce 
qui se produit si et seulement si det(A) z 0. 


Par exemple, la matrice M de l'exemple 13.3 est inver- 
sible puisque son déterminant vaut -12 + 0. Pour montrer ça, 
nous avons en fait échelonné la matrice et trouvé au passage 
que Em = Id, ce qui établit directement que M est inversible. 
On se demande si l’on y gagne. Il est vrai qu'avec l'habitude, 
on calcule les déterminants assez rapidement en multipliant 
les astuces et les raccourcis lorsqu'on reconnaît certaines ma- 
trices - ça sera particulièrement vrai lorsque nous donnerons 
la deuxième méthode de calcul, qui se prête au calcul mental 
rapide. 

Il ne faut pas trop prendre ça au sérieux, cependant : calcu- 
latoirement, les déterminants ne sont pas un outil révolution- 
naire. Pour une matrice un peu grosse (quelques milliers de 
lignes), dont on veut savoir si elle est inversible à l’aide d’un or- 
dinateur, la meilleure méthode consiste à faire des opérations 
sur les lignes pour obtenir la matrice échelonnée, et les « rac- 
courcis » que les déterminants permettent de prendre n'ont pas 
une influence sensible sur la durée du calcul. 

Les déterminants ont pourtant de nombreuses applications. 
Donnons-en une simple. 


ExEMPLE 13.6 - Soit t € K. Quand est-ce que la matrice 


2 t 
(is) 
est inversible ? Son déterminant vaut 18 + t, donc la condi- 
tion est précisément t + -18. On peut retrouver cette 
condition sans passer par le déterminant, mais c'est moins 
facile à suivre. 


Pour un exemple plus compliqué, soit © un paramètre 
réel. Quand est-ce que la matrice 


cos(8) —sin(6) 
sin(@)  cos(@) 


est inversible? En prenant le déterminant, on ob- 
tient cos(0)? + sin(0)? = 1, donc la matrice est toujours in- 
versible. En faisant des opérations sur les lignes pour trou- 
ver la matrice échelonnée, on se retrouve dans une discus- 
sion très pénible. 


La proposition suivante rend souvent service. 


PropPosirion 13.7 — Soient A et B deux matrices carrées de même 
taille. Alors 

det(AB) = det(A) det(B). 
De plus si A est inversible alors 


1 


A 


Démonstration. La matrice B étant fixée, considérons la fonc- 
tion | définie par (A) = det(AB). On voit tout de suite qu'elle 
vérifie les propriétés (1), (2) et (3) du théorème 13.1. (Noter 
que faire des opérations sur les lignes de AB revient à faire des 
opérations sur les lignes de A, puis multiplier par B.) D'après 
le théorème, il existe une constante a telle que b(A) = adet(A). 

En prenant A = Id, on observe b(Id) = det(Id B) = det(B) = 
adet(Id) = a, c’est-à-dire œ = det(B). Ceci montre que det( AB) = 
det(A) det(B). 

Si A-! existe, on calcule det(AA-l) = det(A)det(A-!) = 
det(Id) = 1. o 


voir les exercices 
1134, 1148, 
1136 


voir l'exercice 
1144 


DÉVELOPPEMENTS DES DÉTERMINANTS 
a] 


DÉFINITION 13.8 - Soit A une matrice n x n. On appelle mineur 
en i, j, et on note A;;, le déterminant de la matrice (n-1)x(n-1) 
obtenue en supprimant la ligne i et la colonne j de A. 


ExEMPLE 13.9 — Soit 


DÉFINITION 13.10 - Notons A = (4;;). Le développement de det(A) 
par la ligne i est 


n 
det;(A) = Y (1) H ajAj . 
ji =Ï 
Le développement de det(A) par la colonne j est 


n 
det/(A) = Y (1) HajA;j » 


i=l 


(Cette fois c'est l'indice i qui varie dans la somme.) 


ExEMPLE 13.11 — Prenons 


0 -1 -1 
A=| -2 0 5 
-3 0 -1 


Pour gérer le signe (=1)'*, le plus simple est de former un 
tableau : 


La règle est simple : on commence par + en haut à gauche, 
et on alterne de sorte qu’il n’y a jamais deux signes iden- 
tiques côte à côte. 

Pour développer par rapport à la première ligne, di- 
sons, on prend les mineurs et les coefficients dans la ma- 
trice, les signes dans le tableau, et on ajoute : 


0 5 =2 5 -2 0 
det, (A) = +0x 0 -1 -1x + -1 fx 3 0 | 
=0+17+0=17. 

Par rapport à la troisième colonne, on a 
Ba -2 0| 0-1 |, 0 -1 
det” (A) =+(=1)x -3 Ü 5x -3 0 +(=1)x 2 0 


=0-5x(-3)-(-2)=17. 


Ce n'est pas un hasard si on trouve le même résultat. 


ProposiTION 13.12 — Pour tout i et tout j, on a 
det;(A) = det/(A) = det(A). 


En d'autre termes, le développement donne une formule pour cal- 
culer le déterminant, en fonction de déterminants plus petits. 


Démonstration. Pour l'instant nous allons nous contenter d’une 
esquisse de démonstration. Dans la suite du chapitre un argu- 
ment complet sera donné. 

L'idée simple est que A H> det;(A), vue comme une fonc- 
tion M,(K) > K, vérifie les propriétés (1), (2), (3) et (4) du théo- 
rème 13.1. D'après ce théorème, une telle fonction est unique, 
donc det;(A) = det(A). On procède de même pour det! (A). 

Il faut donc vérifier soigneusement ces quatre propriétés. 
Ce n'est pas difficile (c'est même un bon exercice), mais c'est 
un peu long. 


CoroLLAIRE 13.13 - Le déterminant d’une matrice peut s'expri- 
mer en fonction des coefficients par des opérations algébriques 
simples (additions et multiplications). En particulier, si une ma- 
trice A E M,(C) a ses coefficients dans R, Q ou même Z, alors son 
déterminant est un élément de R, Q ou Z respectivement. 


Démonstration. C'est vrai pour les matrices 2 x 2 de par la for- 
mule ad — bc, et grâce à la proposition on peut faire une ré- 
currence. Le corollaire sera par ailleurs évident lorsqu'on aura 
donné une définition du déterminant, plus loin dans ce cha- 
pitre. 


On a donc une nouvelle méthode, complètement différente, 
pour calculer les déterminants. Est-elle meilleure ? En théorie 
la réponse est cinglante : non, elle est même bien pire. Pour s'en 
convaincre, comptons le nombre de multiplications nécessaires 
pour calculer un déterminant de taille n x n. En échelonnant la 
matrice, on peut montrer qu'il faut quelque chose de l'ordre 
de n? multiplications pour avoir le déterminant. En dévelop- 
pant par une ligne, puis en développant les déterminants plus 
petits, etc., jusqu’à en arriver à des déterminants 2 x 2, on fait 
plus de n! opérations. 

Prenons n = 50. À l’aide d’un ordinateur qui effectuerait 
un milliard de milliards d'opérations par seconde (101$), il 
faudrait plus de 1038 ans pour compléter le calcul par cette 
méthode. L'univers selon les dernières estimations existe de- 
puis 15x10° ans. En échelonnant la matrice, les 2500 multipli- 
cations nécessaires sont faites presque instantanément. 

En pratique, pour des matrices de très petite taille (n < 6) 
comme vous en rencontrerez dans les exercices, et sans ordi- 
nateur, on combine souvent différentes méthodes : opérations 
sur les lignes, sur les colonnes, et quelques développements. 
Voyons un exemple. 


EXEMPLE 13.14 - Prenons 


0 1 0 1 
2 -1 9 0 
A= 2 7 Æ =5 
2 0 -1 =1 


Pour calculer det(A), on peut commencer par retrancher 
la deuxième colonne à la dernière, ce qui ne change pas le 
déterminant. On obtient 


0 1 0 0 
2 -1 9 1 
de(A)=|> 7 4 -12 
2 0 -1 -1 


Maintenant on développe par la première ligne, évidem- 
ment, puisqu'elle a tellement de zéros : 


2 9 1 
det(A)=-| 2 4 -12 |, 
Z =Ï À 


en n'oubliant pas le signe - qui vient du tableau de signes 
correspondant. 
On retranche la première ligne aux suivantes : 


2 9 1 
det(A)=-| 0 -5 -13 |, 
0 -10 -2 


puis on effectue L3 = L; -2L; : 


2 9 1 
det(A)=-| 0 -5 -13 
0 0 24 


Nous sommes déjà habitués aux déterminants de cette 
forme « triangulaire ». On peut mentalement faire le dé- 
veloppement suivant par la première colonne : 


2 9 1 
0 -5 -13 =2| 
0 0 24 


-5 -13 


+ |= 2x (-5)x24 = -240. 


(D'une manière générale, le déterminant d’une matrice tri- 
angulaire est le produit des coefficients sur la diagonale.) 
Finalement det(A) = 240. 


reprendre les 
déterminants des 
exercices 
précédents par 
cette nouvelle 


méthode 


LES FORMULES DE CRAMER 
a 


Nous allons maintenant voir une formule pour calculer l'in- 
verse d’une matrice, qui est une généralisation de celle donnée 
dans la proposition 12.9. 

Soit A = (a;;) une matrice. On pose 


A=((-1)*/A;;);;, 


et on l’appelle la comatrice de A. (On rappelle que le « mi- 
neur » A;j a été introduit dans la définition 13.8.) 


ProposirioN 13.15 - On a 


A'À = det(A)ld. 


Démonstration. Sur la ligne i, dans la colonne j du pro- 
duit A‘À,ona par définition le nombre 


n 


Cij = Y _an(-1} A;r. 


k=1 


Lorsque i = j, on reconnaît la formule pour le développement 
de det(A) par la ligne i, donc c;; = det(A). Lorsque i + j par 
contre, on obtient le développement de det(A’) par la ligne j, 
où A’ est la matrice obtenue à partir de A en recopiant la ligne i 
dans la ligne j; comme A’ se retrouve avec deux lignes iden- 
tiques, son déterminant est nul, donc c;; = 0 pour i # j. 
Finalement A'À n’a de coefficients non-nuls que sur la dia- 
gonale, où l’on trouve det(A), comme annoncé. 


CoRoOLLAIRE 13.16 (FORMULES DE CRAMER) - Soit À une matrice 


inversible. Alors i 
Al = EA, 
det(A) 


Démonstration. D'après la proposition, on a 


t A| _ 
Al A)=u, 


ce qui donne le résultat (voir lemme 12.23). 


ExEMPLE 13.17 — Prenons 


A= 


1 -3 -1 
1 -4 01. 
0 1 2 


Pour calculer la comatrice, on commence par le coefficient 
en haut à gauche, qui doit être 


-4 0 
|i =. 


Le coefficient sur la ligne 1, dans la colonne 2, est 


1 0 
-| 0 2 |=-2. 


(On n'oublie pas le signe.) Ainsi de suite, on finit par obte- 


nir 
-8 -2 1 
5 2 =1 1. 


-4 -1 -1 


À = 


On calcule det(A) = -3. Finalement 


1 —8 5 -4 8⁄4 - 3 A 
Antee -2 2 -1 |=| 3⁄4 73 1⁄3 
Ï <Ï. =ï Uz. UW Y 


Cette méthode de calcul de l'inverse est déraisonnablement 
populaire auprès des étudiants. Pourtant, elle est beaucoup 
moins efficace que la méthode de la proposition 12.19 (on peut 
de nouveau compter le nombre d'opérations effectuées, et il est 
largement supérieur avec les formules de Cramer). C'est pour- 
quoi nous n'insisterons pas sur les exemples. 

Par contre les formules de Cramer ont des conséquences 
plus théoriques, par exemple : 


Lemme 13.18 - Soit A une matrice à coefficients dans Z. Alors A 
possède une inverse à coefficients dans Z si et seulement si det( A) = 
Aile 


Démonstration. Si det(A) = +1, la formule pour A-! montre 
bien, en gardant le corollaire 13.13 à l'esprit, que ses coeffi- 
cients sont des nombres entiers. 

Réciproquement, si A-! est à coefficients dans Z, on note 
que det(A)det(A-l) = 1 alors que det(A) et det(A-!) sont des 
nombres entiers, encore par le corollaire 13.13. Ceci entraîne 
bien sûr que det(A) = +1. 


Autre application, nous pouvons maintenant répondre à la 
question posée dans l'exemple 4.29 : 


LEMME 13.19 - La fonction 


GL,(R) => GL,(R) 
A + A 


est continue. 


D'après l'expression pour Al, et le corollaire 13.13, c'est 
évident. 


- Fin de la première lecture - 


UNICITÉ DU DÉTERMINANT 
mi] 


Nous allons nous tourner vers la démonstration du théo- 
rème 13.1. La partie « unicité » est en fait très simple, et en 
réalité nous l’avons presque déjà vue. 

En effet, si p: M,(K) > K vérifie les fameuses proprié- 
tés (1), (2), (3) et (4), alors pour calculer b(A), on peut faire 
des opérations sur les lignes dont on sait précisément comment 
elles changent la quantité (A), et se ramener à une matrice 
échelonnée. Mais pour une matrice échelonnée, on constate 
que b prend la valeur 0 s’il y a une ligne nulle, ou 1 sinon 
(voir la discussion dans l'exemple 13.4 et la démonstration de 
la proposition 13.5). Finalement, on n’a tout simplement pas le 
choix pour la valeur de b(A). D'où l'unicité d’une fonction qui 
vérifierait les quatre propriétés. 

Si | ne vérifie pas la propriété (4), on pose aœ = (Id). 
Si a + 0, on travaille avec (A) = b(A)/a qui vérifie les quatre 
propriétés, et donc (A) = det(A) ce qui donne bien (A) = 
adet(A). Si par contre a = 0 on voit facilement que D(A) = 0 
pour toute matrice À en raisonnant comme ci-dessus; là en- 
core (A) = adet(A) = 0. 

Toute la difficulté réside dans l'existence de la fonction 
déterminant. Avec la formule pour le développement du dé- 
terminant, on pourrait donner une définition par récurrence, 
en partant des matrices 2 x 2. C'est possible, mais certaines 
choses vont être difficiles à montrer, comme par exemple le fait 
que det(A) = det(* A). Nous allons utiliser une autre approche, 
qui est plus instructive. 

Faisons une observation sur les matrices 3 x 3. En dévelop- 
pant par les lignes ou les colonnes, on obtient 


aij 412 413 
421 422 423 | — 4134224031 + 41242343] + 413421432 
431 432 433 


— 4114234392 — 412421433 + 411422433. 


On constate que le déterminant (s’il existe!) est une somme 
de termes de la forme 41; 4), +: Ani, précédés de signes conve- 
nables. Même si ça paraît compliqué, nous allons partir de là 
pour donner une définition générale. 


PERMUTATIONS 
D 


DériniTIoN 13.20 - Soit X un ensemble. Une permutation de X 
est une bijection o: X > X. 

Nous allons particulièrement nous intéresser au cas X = 
{1,2,3,...,n}. On notera 5, l’ensemble des permutations de 
ce X, et on appelle 5, le n-ième groupe symétrique. 


On trouve bien d’autres notations pour le groupe symé- 
trique, comme par exemple S„ ou »;. 


ExEMPLE 13.21 - Nous allons avoir besoin d’une notation 
pour donner des exemples. Nous allons écrire 


c'est-à-dire que, par exemple, 


123 
=| 3.2 1 


est un raccourci pour désigner la fonction o, définie de 
l'ensemble (1, 2,3) vers lui-même, telle que o(1) = 3, o(2) = 
2 et o(3)=1. 

Pour vérifier que o est bien une bijection, et donc un 
élément de S3, le plus simple est de constater que o(o(i)) = 
i pour i =1,2,3, donc ol =o. 

Voyons un élément de Ss : 


(1 234 5 
E V\23.3 d Ed 
Pour montrer que rt est une bijection, donnons directement 


sa réciproque : 
a (1 2 3 4 5 
T =[312 5 à) 


On vérifie que t(t(i)) = i et T (t(i)) = i, ce qui justifie 
la notation t !. Pour trouver ce t !, la recette que nous 
venons d'appliquer est simple : pour chaque i on cherche 
le nombre j tel que t(j) = i, qui doit exister et être unique 
(sinon t n'est pas une bijection); c'est ce nombre que l'on 
écrit en dessous de i, c'est-à-dire que j =T (i). 

Voici une façon encore plus simple de le dire : échan- 
geons les deux lignes de la matrice de t, puis déplaçons les 
colonnes pour que sur la première ligne on ait 1,2,3,4,5 
dans cet ordre. On obtient la matrice de t !. 


DÉFINITION 13.22 - Soit o € S„. Pour deux entiers distincts i et j 
entre 1 et n, on pose 


On a qij = qji, de sorte que qij ne dépend que de la paire (i, j}. 


On pose ensuite 
e(o) = T Gaje 
t.j) 


On appelle e(o) la signature de o. 


ExEMPLE 13.23 - Prenons 


1 2 3 
o| Í 3 ï Jess. 


Les paires à considérer sont (1, 2}, (1,3), (2, 3}. On trouve 


382 _ 1-2 _ 1 E E > 
42-57 93=3_-q1 > 9233-77 * 
Finalement e(o) = 1 x -1 x (=2) =1 


Notons que la quantité q;; est positive si o(i) et o(j) sont 
« dans le même ordre » que i et j, et négative sinon : on dit 
alors qu'il y a une inversion en i, j. 


Lemme 13.24 — Pour toute permutation o, on a e(o) = +1. 


Démonstration. Montrons que |e(o)| = 1. En posant dij = |j - il, 
de sorte que dij = d;;, on peut écrire [e(o)| = N/D avec 


N=[| [dot et D= 
) 


dij. 
lij | 


(Lj 


On doit donc montrer que N = D. Or c’est une évidence : 
dans les deux cas, il s’agit du produit de tous les nombres d;; 
pour toutes les paires {i,j}. Voici une autre formulation : pour 
chaque terme d;; du produit D, considérons i’ = o !(i) et j/ = 
o !(j). Alors N contient le terme dô(i’jo(j) = dij. Ainsi chaque 
terme du produit D correspond à un terme et un seul du pro- 
duit N, et vice-versa, d’où N = D. 


COROLLAIRE 13.25 — Soit N le nombre d'inversions pour o. Alors 


Démonstration. Seul le signe de q;; compte, dans le calcul de la 
signature e(o), puisqu'en valeur absolue on sait déjà que [e(o)| = 
1. Ce signe vaut (-1) si et seulement si on a une inversion en i, j, 
donc au total le signe est (-1)N. 


ExEMPLE 13.26 - Fixons i et j et considérons la fransposi- 
tion ti; E S,, définie par t;(i) =j, t;(j) = i et tij(x) = x 
si x #i,j. En d’autres termes, 1;; échange i et j et fixe les 
autres éléments. Par exemple dans 5; on a 


Calculons la signature de 7;;, en supposant i < j. En 
comptant les inversions, on constate que l’on en obtient 
une pour la paire (i, j}, une pour chaque paire (i, x} avec i < 
x < j, et une pour chaque paire {x, j} avec i < x < j. On 
peut regrouper ces dernières inversions par deux en as- 
sociant {i,x} et (x, j}, ce qui rassemble un nombre pair de 
signes (-1) dans le calcul de e(o). L’inversion pour {i,j} 
reste seule, et au total 


E(T;j) = P 


DÉFINITION 13.27 — Soient © et t des éléments de S„. La com- 
position o o t définie par oo t(i) = o(t(i)) est encore un élément 
de S„, que l'on va noter ot par simplicité. La composition est 
parfois appelée le produit de o et t. 

ProposirioN 13.28 — Pour o, tT E€ S„, on a 


elot) = e(o) e(r). 


Démonstration. Écrivons 


Multiplions ces égalités pour toutes les paires (i, j}, on obtient 


m ot(j) - ot(i) 
e(ot) [| TES TG e(t). 


Il ne reste qu’à montrer que le produit entre parenthèses est 
effectivement e(o), c'est-à-dire que 


otlj)-otli) _ p+ SG) =o) 
L F= UI => 


{Lj} (Lj) 


Or chaque terme d’un de ces produits se retrouve une fois 
et une seule dans l’autre (comme dans la démonstration du 
lemme 13.24), donc ils sont bien égaux. 


le symbole S est 
un S majuscule 
en écriture 
gothique 


allemande. 


Certains auteurs 
et certains 
logiciels 
préfèrent la 
notation To au 
lieu de ot. 
Attention ! 


LA DÉFINITION DU DÉTERMINANT 


La voici enfin : 


DÉFINITION 13.29 — Soit A = (4;;) € M, (K). Son déterminant est 


det(A) = ` E(0)415(1)4206(2) ` `` Ano(n) - 


CES, 


Nous allons montrer toutes les propriétés (attendues depuis 
l'énoncé du théorème 13.1) sous forme de lemmes. 


Lemme 13.30 — On a det(A) = det(! A). 


Démonstration. On doit vérifier que 


De E(0)416(1)420(2) *** Ano(n) = + E(6)45(1)140(2)2** * Ao(n)n: 


CES, 6€S; 


Fixons o, et observons les nombres 4,(;). En prenant i = o (j), 
pour un entier j quelconque, on obtient as(iji = 4j5-1(j) ; et en 
prenant le produit on a 


46(1)146(2)2 °°" Mo(n)n = 410-1(1)420-1(2) °°" Ano- (n): 


De plus, de la relation oo ! = Id (la permutation identité), on 
déduit e(o)e(o !) = 1 et donc e(o) = (o !). 

Finalement, le terme correspondant à ó dans le membre de 
droite ci-dessus est précisément le terme correspondant à o ! 
dans le membre de gauche. Donc les sommes sont égales. 


Lemme 13.31 — Si A, est obtenue à partir de À en multipliant une 
ligne par À, alors det(A;) = Adet(A). 


Celui-ci est évident ! 


Lemme 13.32 — Si A3 est obtenue à partir de A en permutant deux 
lignes, alors det(A;) = - det(A). 


Démonstration. Soient k et £ les lignes qui sont permutées. 
Si A = (a;;), alors A) = (a(;);), où T = we est la transposition 
comme dans l'exemple 13.26. Le déterminant de cette matrice 
est 

det(A) = x E(0) Ar(1)5(1)44(2)0(2) ` `" Ax(n)o(n) - 


oeES„, 


Notons que 4x(ijo(i) = 4jo((j)) AVEC j = T(i), ou ce qui revient au 
même i = t(j). On en tire 


Ax(1)o(1)4x(2)0(2) ` * ` At(n)o(n) =F 410(t(1))420(t(2)) ` ` ` 4no(t(n)) - 


Combinons ça avec e(ot) = e(o)e(t) = -e(o) encore d'après 
l'exemple 13.26. Finalement 


det(A2) =- 3 E(OT) A1o(1(1))420(1(2)) ` ` ` Ano(r(n))- 


6€, 


Il reste à observer que la somme ci-dessus est det(A) : en ef- 


fet le terme correspondant à o dans la définition de det(A) se 


retrouve dans cette somme correspondant à ot !. 


Pour le reste des démonstrations, fixons une matrice A, 
et choisissons une ligne i. Pour x;,x2,...,X„ € K, on va no- 
ter f(x1;,...,x„) le déterminant de la matrice obtenue en rem- 
plaçant la ligne í de A par (x1,...,x,). Par exemple si A = (4;;) 
est une matrice 3 x 3 et que l’on regarde la ligne 2, cela signifie 
que 

411 412 413 
f(x1,Xx2,X3) =| X1 X2 %3 
431 432 433 


En particulier on a det(A) = f(a;1,4;2,...,a;,). 
D'après la définition 13.29, il est bien clair qu'il existe des 
nombres que l’on va noter À, À2,... , À, tels que 


f(X1,...,Xn) = à1 x1 + À2X2 + + Aix. (*) 


En conséquence, on note que f(x; + Y1,...,Xn + Yn) = 
f(X1,....Xn) +f (Vis. Vu). 


Lemme 13.33 - Les formules de développement du déterminant par 
une ligne ou une colonne sont valides. 


Démonstration. Puisque det(A) = det(‘A), il suffit de montrer 
ceci pour les lignes. D’après la définition 13.10, nous devons 
donc montrer que Àj = (-1)#A;;, avec les notations ci-dessus. 

Notons que À; = f(0,...,0,1,0,...,0), avec le 1 en j-ième po- 
sition, d’après (*). On peut donc voir À; comme le déterminant 
d’une certaine matrice; en permutant i lignes et j colonnes, 
cette matrice devient 


* 


où M est obtenue à partir de A en supprimant la ligne i et la 
colonne j. Les opérations sur les lignes et colonnes ont intro- 
duit le signe (-1)'*/, c'est-à-dire à; = (-1)'*i det(B). Nous allons 
montrer que det(B) = det(M); par définition A;; = det(M), donc 
on aura bien établi que le déterminant À; est (-1) "i A;;. 

Nous sommes donc ramenés à un cas très particulier de 
développement par une ligne, celui de montrer que det(B) = 
det(M). Écrivons B = (bze), de sorte que 


det(B) = Y e(o)bio() "+ brotn): 


6€, 


L'essentiel est que b, = 0 pour 1 < € < n. Si o est une per- 
mutation telle que o(n) + n, on a un terme nul dans la somme 
ci-dessus ; autrement dit on peut se contenter de regarder les o 
tels que o(n) = n; et comme b,n = 1, il reste 


det(B)= D e(0)B10(1)*"> Pn-1,0(n-1) 


oESpn 
o(n)=n 


Faisons l'observation suivante. Si o € 5, vérifie o(n) = n, alors 
on obtient une permutation de {1,2,...,n - 1} par restriction 
de o. Si on note o’ € S„_1 la restriction de 6 € S„, on obtient 
en fait une bijection entre 5,_; et les permutations de 5, qui 
« fixent » n. De plus, la signature de © est égale à celle de o’. 
Finalement 


det(B)= J e(0)b10641) = Pn-1,04(n-1) = det(M), 


o’eS; 1 


par définition. 


Lemme 13.34 - Lorsque la matrice A possède deux lignes iden- 
tiques, on a det(A) = 0. 


Démonstration. En permutant ces deux lignes, on ne change 
pas A; donc det(A) = - det(A). On en déduit que det(A) = 0. 
Les plus observateurs auront noté que cet argument ne 
fonctionne que parce que 1 + -1, on encore 2 + 0. Or il se peut 
très bien que 2 = 0 si l’on travaille avec K = Z/2Z, ce qui n'est 
pas exclu ! Pour couvrir ce cas, on peut faire une démonstration 
du lemme par récurrence, en partant des matrices 2 x 2 et en 
développant par une ligne à l’aide du lemme précédent. 


Voici finalement la dernière propriété : 


Lemme 13.35 — Si A3 est obtenue à partir de A en ajoutant un 
multiple de la ligne j à la ligne i, alors det(A3) = det(A). 


Démonstration. On a 


det(A3) = fa; + Mji, di2 + AGj2,..., Ain + Mjn) 
= fais din... Ain) + Af (Aji, 4j2,..., Ajn) 
= det(A)+0. 


En effet f(a;1,4;2,...,4a;,) = 0, puisque c'est le déterminant de 
la matrice obtenue en recopiant la ligne j dans la ligne i (et qui 
possède donc deux lignes identiques). 


Chapitre 14 


Espaces vectoriels 


On rappelle que la lettre K désigne Q, R ou C. 

Au collège on vous a présenté les vecteurs, dans le cadre 
de la géométrie élémentaire dans le plan ou l’espace. Ces mé- 
thodes sont tellement efficaces que l’on souhaite les appliquer 
le plus largement possible, non seulement en « dimension » 
quelconque, mais également dans des cadres abstraits. Un « es- 
pace vectoriel » va être défini comme un ensemble sur lequel 
on peut faire ce type de géométrie. 

Il se trouve que les calculs que nous allons être amenés à 
faire se ramènent presque tous à des opérations sur les ma- 
trices, que nous savons déjà exécuter. Ce chapitre présente une 
organisation abstraite de ces calculs, en quelque sorte. Au fur 
et à mesure de vos études en mathématiques, les espaces vec- 
toriels vont prendre de plus en plus de place. 


DÉFINITIONS & EXEMPLES FONDAMENTAUX 
T) 


DÉFINITION 14.1 — Un espace vectoriel sur K est tout d'abord un 
ensemble E possédant un élément distingué noté 0g ou simple- 
ment 0, que l’on appelle le vecteur nul de E ; on suppose ensuite 
que E est muni d’une opération d’addition 


ExE — E 
(u,v) H> u+v 


et d'une opération 


KxE => E 
(Au) => 


satisfaisant les axiomes suivants : 


(a)u+v=v+u, (e) A-(u+v)=À-u+A:v, 
(b) 0g +u =u, €) (A+p)-u=\À\-u+p-u, 
(c) (u +v) +w =u + (v + w), (g) 1-u=u, 

(d) Vu 3(=u) tel que u +(=-u) =0g, (h) (Ap)-u =A- (u-u), 


pour u,v,w E E et À,p e K. 


ExEMPLE 14.2 -L'exemple le plus fondamental, sans 
conteste, est celui de K”. On identifie, comme d'habitude, 
les éléments de K” avec les matrices-colonnes de M, (K), 
et les opérations sont celles que l'on connait bien : 


X1 yı xı +7 
X2 y2 X2 +72 
+ . = . 2 
Xn Yn Xn + Yn 
et 
xj ÀX, 
X2 1x2 
À: = . 
Xn ÀXy 


Le vecteur nul est, bien sür, celui dont toutes les coordon- 
nées sont nulles. On vérifie sans problème que les axiomes 
(a-b-c-d-e-f-g-h) sont satisfaits, donc IK" est un espace vec- 
toriel sur K. En fait la proposition 12.7 nous indique que 
l'ensemble M, „„ (IK) des matrices est aussi un espace vecto- 
riel. 


ExEMPLE 14.3 - L'ensemble K[X] des polynômes à coeffi- 
cients dans K est un espace vectoriel sur K, la vérification 
des huit axiomes étant immédiate. Ici le « vecteur nul » 
est le polynôme nul, celui dont tous les coefficients sont 
nuls. C'est un premier pas vers l'abstraction : de par leurs 
bonnes propriétés, les polynômes peuvent être vus et ma- 
nipulés comme des vecteurs ! 


ExEMPLE 14.4 -Soit A un ensemble quelconque. No- 
tons F(A, K) l'ensemble des fonctions A > K. Si f et g sont 
de telles fonctions, on définit leur somme f + g de la ma- 
nière la plus simple, par la formule (f + g)(x) = f(x) + g(x), 
pour x € A. De même si À € K, on définit À- f par (A: f (x) = 
Af (x). 

On vérifie que F(A,K), avec ces opérations, est un es- 
pace vectoriel sur K. Les fonctions sont donc aussi des vec- 
teurs. Le « vecteur nul » dans cette situation est la fonction 
identiquement nulle, c'est-à-dire la fonction f : A — K dé- 
finie par f (x) = 0 pour tout x € A. 


SOUS-ESPACES 
Em 


La quasi-totalité des espaces vectoriels que nous allons ren- 
contrer vont être bâtis à partir des trois exemples précédents, 
en ajoutant des conditions supplémentaires. Nous allons utili- 
ser la notion suivante : 


DériniTIoN 14.5 — Soient E un espace vectoriel et F C E une 
partie non vide. On dit que F est un sous-espace vectoriel 
de E lorsque les deux conditions suivantes sont remplies : 
pour u,v € F, on doit avoir u + v e F, et pour À e K et v EF, 
on doit avoir À - v E F. 


Il est clair qu'un sous-espace vectoriel est lui-même un es- 
pace vectoriel, et c'est notre principale source d'exemples. Pour 
certains étudiants (par exemple certains chimistes), la seule no- 
tion «au programme » est celle de sous-espace vectoriel de R”. 
Et pour tout le monde, c'est l'exemple à comprendre en pre- 
mier. 


ExEMPLE 14.6 - Voici un exemple générique de sous-espace 
de K”. Donnons-nous une matrice A € M,,,(K) et considé- 
rons 

E={vekK"|Av=0}. 


(Là encore on identifie les éléments de IK” avec des 
matrices-colonnes, donc le produit Av a un sens.) Alors E 
est un sous-espace de K”. En effet si u et v sont dans E, on 
a Au = Av = 0, donc A(u +v) = Au + Av = 0, donc u +v e E. 
On vérifie de même que A(Av) = ÀAv = 0 si Av = 0, 
donc àv E E si v E E. 

Par exemple, prenons 


-3 1 2 
a=| 0 8 wat). 


Définissons E comme ci-dessus, et prenons un élément 


0 


` 
R 
+ 
œ 
N 
Il 


Á 4424 +» 


On dit que ce sont les équations qui définissent E. On re- 
tiendra que les solutions d'un système linéaire, dont le 
« second membre » est 0, forment un espace vectoriel. 


ExEMPLE 14.7 - On note K„[X] l'ensemble des polynômes 
dont le degré est < n. Alors K„[X] est un sous-espace vec- 
toriel de l'espace K[X] (vérifiez-le). 


Voyons un exemple plus abstrait. 


ExEMPLE 14.8 - Soit C(I, R) l'ensemble des fonctions conti- 
nues sur l'intervalle I. On a C(I, R) C F (I, R), et la proposi- 
tion 4.11 nous dit que c’est un sous-espace vectoriel. 

On peut remplacer « continue » par « dérivable », ou en- 
core « paire », ou « impaire »...On peut même considérer 


E= {f € F (L,R) |f est dérivable deux fois et 3f”-5f'+f = 0}, 


on vérifie que E est alors un sous-espace vectoriel 
de F(L, R). 


voir les exercices 
886, 888, 893, 
5164, 5165 


FAMILLES GÉNÉRATRICES 
| "| 


Pour décrire un sous-espace vectoriel, il est très commun de 
donner des équations comme dans l'exemple 14.6, mais il y a 
une autre méthode également utile. 


DÉFINITION 14.9 — Soit E un espace vectoriel, et soient e1,€2,..., 
e, des éléments de E. Une combinaison linéaire de ces éléments 
est une somme de la forme 


Me +le)+-.-+À,e,, 


avec À; E K. 
L'ensemble des combinaisons linéaires de e,, ez, ..., e, est 
noté Vect(e,...,e,). 


Lemme 14.10 - L'ensemble Vect(e;,...,e,) est un sous-espace vec- 
toriel de E. 


Nous dirons de Vect(e,.,..., e„) que c’est l’espace engendré par 
les vecteurs e1,...,e,. 


Démonstration. On fait un calcul direct. Prenons 
u = je + pe» ++ Apen € Vect(e;,...,e,) 


et 
V = ej +Pp262 + >> + Pue, E Vect(e,,...,e„,), 


on a alors 
x+y = (M +p1)e1 + (A2 + p2)ez +++: + (Àn + uses. 


Ainsi u +v € Vect(e1,..., e). De même on voit que Àv appartient 
au vect si c'est le cas de v. 


ExeMPLe 14.11 — Prenons E = R`, puis 


1 3 
e, = 5 et e= 0 
-2 -1 


Comment vérifier si un élément quelconque de R3, disons 


appartient à Vect(e1,e2)? Par définition v € Vect(e,.,e2) si et 
seulement s'il existe deux nombres À et À, tels que v = 
Me; + A2e2. En écrivant ceci, on tombe sur le système sui- 
vant : 
À + 31 = x 
5\ = Y 
—2À; = 31 = Z 


Nous savons faire; commençons par L. = L2-5L4 et L} = 
L3 + 2L; ; 


À + 31 = x 
=15Àz;_ = Y-5%X 
313 = z+2x 


Faisons L; < L; + 5L3, puis échangeons les deux dernières 
lignes : 


À + 31 = x 
3À„, = z+2x 
0 = 5x+y+5z 


Pour que v € Vect(e1,e)), il est donc nécessaire que 5x + y + 
5z = 0. Mais réciproquement, si 5x+y+5z = 0, alors on peut 
résoudre le système (à savoir, Àz = L(z+ 2x) et Àj = x-3) = 
-x - z, mais peu importent ces valeurs). Donc finalement 
l’espace vectoriel Vect(e;,e,) est complètement décrit par 
l'équation 5x + y + 5z = 0. 

Il est important de savoir passer d'un espace « décrit 
comme un vect » à une description « par des équations » 
comme dans l'exemple 14.6. On peut toujours le faire sur 
le modèle du calcul ci-dessus. Plus loin nous verrons com- 
ment faire la transition inverse (vous pouvez déjà essayer 
d'imaginer la méthode). 


Les descriptions par des équations permettent de vérifier 
rapidement si un élément donné appartient au sous-espace en 
question ; les descriptions par les vects permettent d'obtenir 
facilement des vecteurs appartenant au sous-espace. 

Un espace vectoriel donné peut être décrit comme un vect 
de plusieurs façons, et nous allons nous attacher à trouver les 
meilleures familles de vecteurs, notamment celles contenant le 
plus petit nombre d'éléments. Commençons par donner une 
définition : 


DÉFINITION 14.12 - Soient E un espace vectoriel et e,,e2,...,e„ 
une famille d'éléments de E. On dit que c'est une famille géné- 
ratrice de E lorsque E = Vect(e,,..., en). 


ExEMPLE 14.13 - Prenons E = R? et 


si} (2) 


Écrivons simplement 


| y J=- 0 Je l |= se +per: 


On constate bien que tout vecteur de R? peut s'écrire 
comme une combinaison linéaire de e, et ez, donc e4, e2 est 
une famille génératrice de R?. 

Il y en a d’autres, par exemple prenons 


{8} =) 


7 à x | 
La condition pour qu'un vecteur pa appartienne 


à Vect(e,e2) est l'existence de deux nombres À et À) tels 
que 


21 + Àz = x 
32, + Àz Y 


Le déterminant du système est 2x1-3x1 = -—1 + 0, donc la 
matrice correspondante est inversible (ou si vous préférez, 
la matrice bien échelonnée correspondante est l'identité), 
donc le système a une solution unique. On peut si on le 
souhaite trouver les valeurs de À; et À), mais peu importe : 
de toute façon, nous savons que £4, €72 est une famille géné- 
ratrice de R?. 

Enfin, notons que la famille e4, ez, £1, €2, qui comporte 4 
éléments, est également génératrice par définition. Et pour 
terminer, nous avons vu un exemple de famille qui n'est 
pas génératrice dans l'exemple 14.11, puisque le vect en 
question n’était pas R? tout entier mais un sous-espace dé- 
crit par une certaine équation. 


En fait dans le cas où E = K”, on peut se ramener à des 
calculs simples sur des matrices : 


ProposiTION 14.14 — Soit e,,e,...,e, une famille de vecteurs 
de K", et soit A E M„ Ô(K) la matrice dont les colonnes sont les 
vecteurs e;. Enfin soit EA la matrice bien échelonnée associée. 

Alors e1,€2,..., €m est une famille génératrice de IK" si et seule- 
ment si EA comporte un pivot dans chaque ligne. 


Remarquons que la condition revient à demander que Ea 
ne comporte pas de ligne nulle. 


Démonstration. Par définition, la famille est génératrice si et 
seulement si pour tout v € K”, il existe 


` 
A=| : 
Àm 
tel que AA =v. 


Supposons que c’est le cas. Prenons une matrice inversible P 
telle que PA = F4 (corollaire 12.22), et choisissons 


0 


v=P lu avec u= 


Dans ce cas le système AA = v équivaut, en multipliant par P, 
à PAA = Pv, soit EAA = u. On constate que la dernière ligne 
de E4 ne peut pas être nulle, sinon EA A se terminerait aussi par 
une ligne nulle, et ce n’est pas le cas de u. Donc aucune ligne 
de E4 n’est nulle, étant donné qu'elle est bien échelonnée. 

Montrons la réciproque, et supposons que E4 n’a pas de 
ligne nulle. Nous devons montrer que le système AA = v a des 
solutions quel que soit v, ou ce qui revient au même en mul- 
tipliant par P, que E4 A = Pv possède toujours des solutions. 
Notons que dans ce cas, puisque E4 est bien échelonnée avec n 
lignes non-nulles, de taille n x m, on peut l'obtenir à partir de 
la matrice identité de taille n x n en rajoutant des colonnes à 
droite. Mais alors si l’on prend 


M 
_| ^n 
^= o l 
0 
on obtient 
M 
À2 
EAA=| . |= les n premières lignes de A, 

^n 


et le système EAA = Pv possède certainement des solutions, 
puisqu'il s'écrit en fait À; = le coefficient sur la ligne į de Pv, 
pour 1<i<n. 


La remarque suivante est très utile : 


COROLLAIRE 14.15 — Si e1,€2,...,€m est une famille génératrice 
de K", alors m > n. 

De plus, si m = n, alors la famille est génératrice si et seulement 
si la matrice A est inversible. 


Démonstration. Si m < n la matrice échelonnée E4, ayant plus 
de lignes que de colonnes, est certaine d’avoir une ligne nulle, 
donc la famille ne pourrait pas être génératrice d’après la pro- 
position. Donc m > n. 

Si m = n, la matrice F4 est carrée; elle ne possède pas de 
ligne nulle exactement lorsqu'elle vaut l'identité, puisqu'elle 
est bien échelonnée. D'après la proposition 12.19, ceci équivaut 
à l'inversibilité de A. 


voir les exercices 
900, 908, 914 


FAMILLES LIBRES 
y 


DÉFINITION 14.16 - Soient E un espace vectoriel et e1,e,,...,e, 
une famille d'éléments de E. On dit que c’est une famille libre 
lorsque l'équation 


Mei + àze +> +À„e„ =0, 


avec À; € K, ne possède qu’une seule solution, à savoir À, = 
=), E (0) 


Nous allons voir que le concept de famille libre est en un 
certain sens le « dual » du concept de famille génératrice. Rapi- 
dement, nous verrons que les familles qui sont à la fois libres 
et génératrices sont particulièrement intéressantes. Mais com- 
mençons par des exemples. 


ExEMPLE 14.17 - Prenons E = R?, puis 


s4 3) < e) 


Pour vérifier si la famille est libre, nous devons examiner 
l'équation à, e + A227 = 0, qui s'écrit comme le système 

-5à, + 31 = 0 

M + 7h = 0 


Le déterminant étant -38 + 0, le système a une solution 
unique, qui est bien sûr À, = à = 0. Donc la famille est 
libre. 


Si maintenant on pose e3 = | g | la famille e}, e2, e3 


8 
est-elle libre ? Le système devient 


0 
0 


à + 7Àz + 83 


= + 312 = 2% 


En faisant Li = Lı + 5L, puis en permutant les lignes, on 


obtient 
M + 7) + 8 À = 0 


381 + 3813= 0 
Le système est échelonné, on prend À; comme paramètre, 
et on tire À; = Àz = -À3z. En particulier, on a la solu- 
tion À = À = 1, À3 = -1, et d’ailleurs on vérifie effecti- 


vement que e, + ep —e3 = 0. La famille n’est donc pas libre. 
(Ceux d’entre vous qui auraient repéré que e, + e2 — e3 = 0 
peuvent simplement faire cette remarque, et il est alors 
établi que la famille n’est pas libre.) 


ExEMPLE 14.18 — Voyons un exemple plus abstrait. On 
prend E = F(R,R), l’espace vectoriel de toutes les fonc- 
tions R > R, et on essaie la famille consituée par e, = cos 
(la fonction cosinus) et e, = sin. Cette famille est-elle libre ? 

On doit étudier l'équation à; e1 +A227 = 0. C'est une éga- 
lité de fonctions, et en particulier le 0 désigne la fonction 
nulle; c'est-à-dire que l’équation est vraiment 


VxeR, À cos(x) + À, sin(x) = 0, 


les inconnues étant À, et À. Or pour x = 0 on trouve À = 0 


et pour x = % on trouve À, = 0, donc la famille est bien 


libre. 


Pour étudier les familles libres dans IK”, on dispose du ré- 
sultat suivant, qu’il est instructif de comparer à la proposi- 
tion 14.14. 


PropPosirioN 14.19 — Soit e1,€2,...,€m une famille de vecteurs 
de K", et soit A € M„ Ò (K) la matrice dont les colonnes sont les 
vecteurs e;. Enfin soit EA la matrice bien échelonnée associée. 

Alors e1,e2,...,em est une famille libre de K" si et seulement 
si EA comporte un pivot dans chaque colonne. 


Démonstration. Pour vérifier si la famille est libre, on doit étu- 
dier le système A A = 0, avec 


M 
À 


Il possède les mêmes solutions que le système échelonné E 4A = 
0. À ce stade on doit se rappeler que les inconnues qui vont 
servir de paramètres dans l'écriture des solutions sont celles 
qui correspondent aux colonnes dans lesquelles il n’y a pas de 
pivot (relire au besoin l'exemple 12.13). 

Ainsi la famille est libre => le système n’a qu’une solu- 
tion => il n’y a pas de paramètres => il y a un pivot dans 
chaque colonne. 


CoroLLAIRE 14.20 — Si e1,€2,...,€m est une famille libre de K", 
alors m<n. 

De plus, si m = n, alors la famille est libre si et seulement si la 
matrice À est inversible. 


Démonstration. Si m > n la matrice échelonnée E4, ayant plus 
de colonnes que de lignes, est certaine d’avoir une colonne sans 
pivot, donc la famille ne pourrait pas être libre. Doncm<n. 
Si n = m, la matrice E, est carrée; elle possède un pi- 
vot dans chaque colonne exactement lorsqu'elle vaut l'identité, 
puisqu'elle est bien échelonnée. D'après la proposition 12.19, 
ceci équivaut à l’inversibilité de A. 


En comparant ce dernier résultat avec le corollaire 14.15, 
on constate que 


COROLLAIRE 14.21 - Considérons une famille comportant précisé- 
ment n vecteurs dans KK". Alors elle est libre => elle est généra- 
trice => la matrice A est inversible. 


Autre observation simple : une famille à la fois libre et gé- 
nératrice de K” doit comporter n vecteurs, ni plus ni moins. 
Ces phénomènes sont généraux dans les espaces vectoriels, et 
nous allons tout de suite le montrer. 


voir les exercices 
2781, 5567 


BASES 


DÉFINITION 14.22 - Lorsqu'une famille est à la fois libre et gé- 
nératrice, on dit que c’est une base de l’espace vectoriel consi- 
déré. 


ExeEMPLE 14.23 -Dans K”, nous venons juste de voir 
qu'une famille e,,e2,..., €m ne peut pas être une base si m + 
n; si n = m la famille est une base exactement lorsque la 
matrice n x n dans laquelle on a rangé ces vecteurs en co- 
lonnes est inversible. 

La base canonique de IK" est celle pour laquelle la ma- 
trice en question est l'identité. En clair 


1 0 0 
1 0 

e = À r €2 = Á x ssij en = 
0 0 1 


ExEMPLE 14.24 - Considérons E = K„[X], l’espace vectoriel 
des polynômes de degré < n. Posons e; = XÍ, pour 0 < i < 
n. Tout polynôme s'écrit comme combinaison linéaire des 
puissances de X, donc la famille est génératrice ; de plus si 


Aoeo+ Me A263 à =0=Ag+A4 X +A X? + +A X", 


alors on a Àg = À =+ = À, = 0 (par définition même de ce 
qu'est le polynôme nul). Donc la famille est libre. 

Finalement la famille 1, X, X?,..., X” est une base, qu'on 
appelle encore la base canonique de K,[X]. Noter qu'elle 
comprend n +1 éléments. 


ExeMPLe 14.25 - Lorsqu'un sous-espace de K” est donné 
par des équations (sur le modèle de l'exemple 14.6), on 
peut facilement en trouver une base. Considérons donc 


E={vek"|Av=0}, 


où A est une matrice. On peut échelonner la matrice sans 
changer les solutions de Av = 0, donc nous allons sup- 
poser que A est échelonnée et donner la méthode sur un 
exemple. Prenons 


1 4 0 i 
a=|0 01 0! v=|? |, 
0 0 0 : 


alors en étudiant Av = 0 on constate que l'ensemble des 
solutions est 


-4 3 
1 0 
E=47 0 +t 0 avec y,tEK 
0 1 
(Pour les calculs intermédiaires, reprendre 


l'exemple 12.13.) Prenons les notations 
-4 


ej = eo = 


r = © 


1 
0 , 
0 


alors nous venons d'écrire que E = Vect(e,,e2), donc e,,eo 
est une famille génératrice de E. On peut vérifier direc- 
tement que la famille est libre, puisque l'équation À ,e, + 
1e) = 0 donne 


-42, + 31 0 
M 0 
0 |o 
À2 0 
d’où à; = ` = 0. La famille est bien libre et c'est donc une 
base de E. 

Ce n'est pas un hasard : lorsqu'on écrit les solutions de 
la manière décrite dans l'exemple 12.13, les vecteurs que 
l'on obtient forment toujours une base. On peut le vérifier 
rapidement dans chaque cas. 


À la fin du chapitre nous verrons comment trouver une base 
d'un sous-espace présenté comme un vect. En attendant, vous 
pourriez écrire des équations pour l'espace et procéder comme 
ci-dessus (mais la méthode que nous verrons est plus efficace). 


voir les exercices 
984, 997, 1013 


COORDONNÉES 
EEE EE 02 


L'intérêt des bases est de permettre l’utilisation de coordon- 
nées, de la façon suivante. Soit e,,e,...,e, une base de l’espace 
vectoriel E, et soit v € E un vecteur quelconque. La famille étant 
génératrice, on peut trouver des nombres À; tels que 


v = je + 2e +... + Anen. 


La famille étant libre, on peut voir que cette écriture est en fait 
unique : en effet, si on a également 


V = M121 + 222 F `++ Unen» 
alors en faisant la différence on obtient 
v =v =0 = (ù = p1)er + (A2 = p2)e2 +++ (Àn - pes. 


Puisque la famille est libre, on doit avoir À\;-1; = 0 et donc À; = 
Mi- 


DÉFINITION 14.26 — Soit Z = e1, €2,...,€„ une base de l’espace 
vectoriel E. Si v € E, les nombres À4,,À2,..., À, tels que 


v = Me + À262 +> + Anen 


sont appelés les coordonnées de v dans la base B. On notera 


ælvl=| . TE, 
^n 
Lorsque la base Z sera évidente d'après le contexte on écrira 
tout simplement [v]. 


ExEMPLE 14.27 - Soit Z = e,,e> la base de R? donnée par 


TOETSE 


C’est bien une base, puisque si nous mettons ces vecteurs 
en colonnes dans 
1 1 
A= j 
1 =l 


alors det(A) = -2 + 0. Prenons maintenant un vecteur 
quelconque de R?, disons 


Pour trouver ses coordonnées \4, à> dans la base H nous 
devons résoudre À1e1 + À2e) = v, ce qui revient à 


A^=v avec ^ =| M | 
À2 


Puisque A est inversible on a 
1 1 1 1 
asaid 2 \( 2 )-( fatte), 


Finalement i | 
5X1+5xX 
abl=( 32172 ). 
2 


X1 — 7 X2 


Par contre si nous appelons © la base canonique (comme 
dans l’exemple 14.23), alors on a tout simplement 


gl[v]=v. 


En effet le calcul est le même que ci-dessus, mais cette 
fois A = Id ; ou encore, cela découle du calcul suivant : 


(i aoet) 


ExEMPLE 14.28 — Considérons maintenant E = K,[X] et 
sa base canonique, c’est-à-dire Z = 1,X,X?,..., X”. Si on 
prend un polynôme P € E et qu’on l'écrit 


P=agj+ajX+ajX2?2+-++++a„X", 


alors par définition 


ælP] = 4 € KL . 


Les coordonnées vont nous permettre de ramener de 
nombreuses questions abstraites sur un espace vectoriel E à 
des questions sur K", que l'on sait traiter. Considérons par 
exemple : 


ProPosirion 14.29 — Soit E un espace vectoriel, et soit B =e, ez, 
.., €, une base. Écrivons [v] pour g[v]. Alors 


1. [u+v] =[u] + [v], 
2. [Av] = Mv], 
3. si E1,€2,...,Em est une famille de vecteurs de E, alors elle est 


libre si et seulement si la famille [£1], [£2], ..., [Em] de vecteurs 
de K" est libre. 


4. idem avec « génératrice » au lieu de « libre ». 


La démonstration est extrêmement facile ; elle vous est lais- 
sée à titre d'exercice important. 

Voici une première application. Le théorème suivant est le 
plus important du chapitre pour l'instant. 


THÉORÈME 14.30 - Soit E un espace vectoriel, muni d'une base 
B = e,e2,...,e,, et soit F = £1, €2,..., Em une famille de vecteurs 
de E. 


1. Si F est génératrice, alors m > n. 
2. Si F est libre, alors m < n. 
3. Si F est une base, alors m = n. 


Réciproquement, si m = n, alors F est génératrice => F est libre 
<> F est une base. 


Démonstration. Elle est très simple. En effet nous avons dé- 
montré tout ceci dans le cas où E = K” : voir le corollaire 14.15 
pour le (1), le corollaire 14.20 pour le (2); le (3) est alors 
évident, et la réciproque est également indiquée dans ces co- 
rollaires. 

Pour le cas général, on utilise tout simplement la proposi- 
tion précédente, qui nous ramène à K". 


Nous constatons que toutes les bases d’un espace vectoriel ont 
le même nombre d'éléments. Ce nombre porte un nom : 


DériniTioN 14.31 - La dimension d’un espace vectoriel est le 
nombre de vecteurs dans une base quelconque. La dimension 
de E est notée dim E. 


ExEMPLE 14.32 - La dimension de K” est n : prendre la base 
canonique. 


ExEMPLE 14.33 — La dimension de K„[X] est n +1 (atten- 
tion !), là encore voir la base canonique 1,X,X2,..., X". 


ExEMPLE 14.34 - L'espace vectoriel K[X] ne possède pas de 
base finie : en effet si P4, P2,..., P, est une famille finie de 
polynômes, alors en prenant N = sup{deg(P;)}, on voit fa- 
cilement que tout polynôme dans Vect(P,,Po,..., P„) est de 
degré < N. En particulier Vect(P,.,..., P„) n’est pas K[X] tout 
entier. 

Dans ce livre nous ne parlerons pas de familles infi- 
nies de vecteurs. Ceci dit, il existe des définitions que vous 
pouvez imaginer de « famille libre », « famille génératrice » 
et « base » ayant éventuellement un nombre infini de vec- 
teurs. Avec ces définitions, on montre que la famille infi- 
nie 1,X,X2,..., X*,... est une base de K[X]. 

Quoi qu'il en soit, nous dirons qu’un espace vectoriel 
est de dimension finie lorsqu’il possède une base finie. Ce 
west pas le cas de K[X], qui est de dimension infinie. 


ExEeMPLE 14.35 -Voici une application célèbre. Pre- 
nons E = R,[X], qui est de dimension n + 1. Choisissons 
un nombre x, € R, et considérons 


ej=(X=xo)' pour 0<i<n. 


Montrons que cette famille est libre : l'équation À9eo + 
À ej + + Aye, = 0 s'écrit 


Ao +M (X — xo) + A2(X — x0)? + + An (X - x0)” =0. 


Le terme en X” dans le membre de gauche est À,X", 
donc À, = 0. Mais alors le terme en X"-! dans le membre de 
gauche est À„_4 X"-!, donc À,_1 = 0. De proche en proche, 
on en déduit que À, = À,_1 = >> = À = Àg = 0. Donc la 
famille est libre. 

Cette famille ayant n + 1 éléments, c'est en fait une 
base d’après le théorème. Autre argument possible pour 
montrer la même chose : écrivons [e;] pour les coordon- 
nées de e; dans la base canonique, alors il suffit de mon- 
trer que la famille [e;] est une base de K"+! (cf proposition 
14.29); or la matrice obtenue en mettant ces vecteurs en 
colonnes est triangulaire supérieure avec des 1 sur la dia- 
gonale, donc son déterminant est 1 et donc elle est inver- 
sible, ce qui établit que les vecteurs forment une base. 

Que l’on prenne un argument ou l’autre, essayez d’ap- 
précier les efforts qui nous sont économisés : montrer di- 
rectement que la famille est génératrice par un calcul naïf 
serait bien pénible. 

On en déduit que tout polynôme P € R„[X] peut s'écrire 
de manière unique sous la forme 


P = ào + A (X — xo) 0-2) +++ +A„(X-xg)". = (*) 


Sachant que cette écriture existe, il est maintenant facile de 
calculer les nombres À;. En évaluant en X = x Ô, on trouve 
déjà À = P(xo). Prenons maintenant la dérivée : 


P’ = À + 2A(X — xo) + zen nA„(X = xo)! | 


On en tire À = P’(x0). En dérivant une deuxième fois on 
voit 212 = P” (xo), puis 613 = P) (x ), et par récurrence on 
montre (faites-le) que k! Àp = PH (xg). 

L'égalité (+) s'appelle la formule de Taylor, qu'on écrit 


donc 
deg(P) 


px = Y PoGo x- rot, 


k! 
k=0 


Dans le chapitre 7, nous montrons que cette formule 
(exacte !) peut se généraliser, de manière approchée, pour 
toute fonction suffisamment dérivable plutôt qu’un po- 
lynôme. Mais l'argument ci-dessus est purement algé- 
brique, et s’appliquerait de la même manière aux poly- 
nômes dans K[X] pour toutes sortes de choix de K. Tout 
juste faut-il donner une définition, algébrique elle aussi, 
de la dérivée d’un polynôme de K[X], et vérifier que les 
propriétés attendues sont bien satisfaites. 


- Fin de la première lecture - 


voir les exercices 
979, 981, 3317 


LE THÉORÈME DE LA BASE INCOMPLÈTE 
| 


Nous avons vu que les bases sont très utiles pour étudier les 
espaces vectoriels, mais qu'il n'existe pas toujours de base finie 
(cf exemple 14.34). Nous aurions bien besoin de critères faciles 
pour garantir l'existence de bases, et c’est le théorème suivant 
qui va en donner. Commençons par un lemme très simple. 


Lemme 14.36 — Soit E un espace vectoriel, soit e, ,..., e„ une famille 
libre de E, et soit v € E tel que la famille e,,e,...,e,,v n'est pas 
libre. 

Alors v € Vect(e,,..., €n). 


Démonstration. Il existe une combinaison linéaire nulle 
Me + > +A„e„+t av =0, 


dont les coefficients ne sont pas tous nuls. On doit donc avoir 
a + O : en effet dans le cas où œ = 0 on aurait 


Me +> + yen =0 


donc À = àz = +- = À, = 0 puisque la famille est libre, ce qui 
est une contradiction. 
On peut donc écrire 


Ï 
v =-=- (Me ++ Anen), 
a 


ce qui montre que v € Vect(e,,..., en). 


Démonstration. Considérons l'ensemble des entiers s tels qu'il 
existe des indices 14,12,...,1; pour lesquels 


Ci laris tns Zin r Biar +> Zi 


est libre ; notons S cet ensemble. Il est clair que de tels indices 
doivent être distincts (pourquoi ?), donc l'ensemble S est fini 
puisque tous ses éléments sont < m. Prenons k = sup S (si S = Ø 
par contre, on prend k = 0). Par définition on a une famille libre 


F =t1,C2,...5Cns gio Sir ++ +> Zig > 


et nous allons montrer que c'est une base. 

Prenons en effet un vecteur g; de la famille &. Si on l'ajoute 
à la famille F , on obtient une famille de n+k+1 vecteurs ; par 
maximalité de k, cette famille ne peut pas être libre. D'après le 
lemme 14.36, on a donc g; € Vect( F). 

C'est vrai pour tous les vecteurs de Ç, donc Vect(Ẹ) c 
Vect( F). Mais Vect(G) = E puisque Ẹ est génératrice par dé- 
finition, et donc Vect(F ) = E également, c'est-à-dire que F est 
bien génératrice. 


COROLLAIRE 14.38 — Si E possède une famille génératrice (finie), 
alors E possède une base (finie). 


Démonstration. C'est ce que dit le théorème dans le cas où Z 
est la « famille vide » (vous pouvez vérifier que la démonstra- 
tion du théorème est parfaitement adaptée au cas où il n’y a 
aucun vecteur dans £). 


Voici une autre conséquence (en toute rigueur c’est surtout 
une conséquence du lemme 14.36). 


CoroLLAIRE 14.39 - Soit E un espace vectoriel de dimension fi- 
nie, et soit F C E un sous-espace. Alors F est de dimension finie 
et dim F < dim E. 

De plus, on a une équivalence F = E => dim F = dim E. 


Démonstration. Si Z est une famille libre de F, alors c'est aussi 
une famille libre de E. Donc Z comprend moins de n éléments, 
où n = dim E (théorème 14.30). 

Prenons maintenant une famille libre Z de F ayant le plus 
grand nombre d'éléments, disons Z = £1,..., lm, avec donc m < 
n. Alors par le lemme 14.36, on voit que tout f € F appar- 
tient à Vect( Z) (puisque la famille £:,...,€,, f ne peut pas être 
libre, par maximalité de m). Cette famille est donc une base, 
et dim F = m < dim E. 

Si on a en fait dim F = dim E, alors prenons une base Z = 
ta,lo,...,€„ de F; c'est une famille libre d'éléments de E, com- 
prenant n = dim E vecteurs, donc c'est une base de E d'après le 
théorème 14.30. Ainsi F = Vect( Z) = E. 


LE RANG D'UNE MATRICE 
/_ rÁ rrc ccr c.Jmquymyuctcc0cc2c2: 


DérFiniTION 14.40 - Soit À € M,,,,(K). On note Vect(A) le sous- 
espace de K” engendré par les colonnes de A. La dimension 
de Vect(A) est appelée le rang de la matrice A. 


Nous allons voir comment calculer le rang. Du même coup, 
nous verrons comment trouver une base d'un espace vectoriel 
donné comme un vect dans K”. En fait, à l'aide de la théorie dé- 
veloppée dans ce chapitre, nous allons donner deux méthodes 
profondément différentes ; le fait qu'elles donnent le même ré- 
sultat est un théorème célèbre. 


Proposition 14.41 - Le rang de A est le nombre de lignes non- 
nulles dans la matrice bien échelonnée E a. 

Pour trouver une base de Vect(A), il suffit de prendre les co- 
lonnes de À qui correspondent aux pivots. 


Attention à la dernière phrase. Elle signifie que si les pivots 
de E; sont dans les colonnes i,,1,,...,i,, alors les colonnes de 
la matrice de départ A numérotées i,1,...,i„ forment une base 
de Vect(A) (notez que le nombre de pivots est égal au nombre 
de lignes non-nulles, bien sûr). De nombreux étudiants font 
l'erreur de proposer les colonnes de E 4 comme base. 


Démonstration. On note g1,g22,....2m les colonnes de A, qui 
forment une famille Ẹ génératrice de Vect(A). Notons i4,..., i, 
les numéros des colonnes de EA qui contiennent les pivots, et 
soit Z = gj. ,...,Zi.. Nous allons montrer que P est une base 
de Vect(A), ce qui prouve les deux assertions du même coup. 

Soit B la matrice dont les colonnes sont les vecteurs de Ø ; 
en d'autres termes B est formée des colonnes de A numé- 
rotées i1,...,1,. Alors la matrice bien échelonnée Ep est elle 
aussi extraite de E4 en gardant les colonnes correspondantes. 
En particulier, Eg possède un pivot dans chaque colonne, par 
construction. D'après la proposition 14.19, la famille Z est 
libre. 

Par contre, prenons un indice i qui n'est pas dans la liste i4, 
..., 1, et rajoutons le vecteur g; à Ø (à sa place dans l'ordre). 
La matrice de cette nouvelle famille, disons C, est obtenue à 
partir de B en réinsérant la colonne de A correspondante. La 
même chose peut être dite de Ec, obtenue à partir de Eg en 
rajoutant une colonne de E4. Cette colonne ne contient pas de 
pivot par construction, et c'est encore la proposition 14.19 qui 
nous permet de conclure que la famille obtenue en rajoutant g; 
à B n'est pas libre. D'après le lemme 14.36, on a g; € Vect(B). 

Finalement, on a Vect(A) = Vect(S) C Vect(B) c Vect(A), 
donc Vect( B) = Vect(A), et H est une base. 


On en déduit la chose suivante : 


CoroOLLAIRE 14.42 - On ne change pas le rang d'une matrice en 
faisant des opérations sur ses lignes. 


Démonstration. Si A' est obtenue à partir de A par de telles opé- 
rations, on a Ea = E4 clairement. 


ExEMPLE 14.43 - Prenons 


7 = 4 0 
A=| 1 2 8 51 
5 =5 =12 =102 


Après quelques opérations sur les lignes, nous obtenons la 
forme bien échelonnée : 


1 0 145 17 
Ea = 0 1 575 119 
0 0 0 0 


Le rang de A est donc 2. Les pivots sont dans les colonnes 1 
et 2 de Ea, donc on va prendre les colonnes 1 et 2 de A: 


7 -1 
e, = 1 , e= 2 
5 —5 


La proposition nous dit que e,,e, est une base de Vect(A). 


Passons à la deuxième méthode : les colonnes vont rempla- 
cer les lignes. Les choses se passent maintenant dans l’ordre 
inverse, car le résultat suivant est assez évident. 


Lemme 14.44 - On ne change pas le rang d’une matrice A en fai- 
sant des opérations sur les colonnes. En fait on ne change même 
pas Vect(A). 


Démonstration. Si A’ est obtenue à partir de A par de telles 
opérations, chaque colonne de A’ est visiblement dans Vect(A). 
Ainsi Vect(A’) C Vect(A). Mais bien sûr on peut retrouver À en 
faisant des opérations sur les colonnes de A’, donc de la même 
manière on a Vect(A) C Vect(A'). 


Dans l'énoncé suivant, on va dire qu’une matrice est éche- 
lonnée en colonnes lorsque c'est la transposée d’une matrice 
échelonnée. En d’autres termes, reprenez la définition de ma- 
trice échelonnée et remplacez « ligne » par « colonne ». En fai- 
sant des opérations sur les colonnes d’une matrice A, on peut 
la mettre sous une forme unique bien échelonnée en colonnes : 
pour s’en assurer, il suffit d'observer que cela revient à mettre 
la transposée *A sous forme bien échelonnée en faisant des opé- 
rations sur les lignes. 


Proposition 14.45 - Le rang de A est le nombre de colonnes non- 
nulles dans la matrice bien échelonnée en colonnes associée à A. 

Pour trouver une base de Vect(A), il suffit de prendre les co- 
lonnes non-nulles de cette matrice échelonnée en colonnes. 


Démonstration. Soit B la matrice bien échelonnée en colonnes 
obtenue à partir de A. D'après le lemme Vect(B) = Vect(A). 
Si g1,22,...,g, sont les colonnes non-nulles de B, il est clair 
que Vect(g1,..., 8r) = Vect(B), donc il suffit de s'assurer que c’est 
une famille libre. Or les pivots étant seuls dans leurs lignes, 
c'est clair (voir l'exemple). 


ExEMPLE 14.46 - Reprenons le même exemple, c'est-à-dire : 


7 =l 4 0 
A=| 1 2 8 51 
5 -5 -12 -102 


En faisant des opérations sur les colonnes, on peut 
mettre À sous la forme 


1 000 
0 1 0 01, 
1 -2 0 0 


et cette matrice est « bien échelonnée en colonnes ». On voit 
de nouveau que le rang est 2. Cette fois-ci, la proposition 
nous dit de prendre 


1 0 
€ = 0 F E€ = 1 
1 —2 


La famille £4, €7 est une base de Vect(A). 


En comparant les deux méthodes, il vient le résultat sui- 
vant, qui est loin d’être évident si on part de la définition : 


THÉORÈME 14.47 - Le rang d’une matrice est égal au rang de sa 
transposée. 


Démonstration. Le rang de A est le nombre de lignes non- 
nulles dans E4, qui est égal au nombre de colonnes non-nulles 
dans ‘E4. Or tE; est bien échelonnée en colonnes, et obtenue à 
partir de ‘A en faisant des opérations sur les colonnes, donc le 
nombre de ses colonnes non-nulles est bien le rang de ‘A. 


voir les exercices 
3318, 980 
(ignorer les 
questions sur 
FNnGetF+6G) 


reprendre les 
exercices 
précédents avec 
le deuxième 


méthode 


Chapitre 15 


Applications linéaires 


On rappelle que la lettre K désigne Q, R ou C. 


DÉFINITION & EXEMPLES 
EE ——_————————. 


DériniTIoN 15.1 - Soient E et F des espaces vectoriels sur K. 
Une application linéaire est une fonction f: E — F telle que 
f(u +v) = f (u) + f (v) pour u,v e E, et telle que f(Av) = Af (v) 
pour tout À € K et tout v € E. 


Notons que dans le cas oà E = F, on dit parfois que f est 
un endomorphisme de E (pour dire que c'est une application li- 
néaire E — E). 


ExEmMPLE 15.2 - L'exemple le plus simple s'obtient en choi- 
sissant une matrice À € M,,,(K). On définit alors une ap- 
plication 
f:K" — K” 
v =œ f(v)=Av. 
(Comme d'habitude, les vecteurs sont vus comme des 
matrices-colonnes.) On vérifie très simplement que f(u + 
v) =A (u +v) = Au + Av = f (u) + f (v), et f (Av) = A - (Av) = 
ÀAAv = àf (v). C'est donc bien une application linéaire. 
Ainsi l'application f : R? — R? définie par 


HH 


est linéaire. 


NS à 
ER 


EXEMPLE 15.3 — Prenons E = F = C, qui est un espace 
vectoriel de dimension 1 sur K = C. Fixons un nombre 
réel 6. L'application f(z) = e/°z est alors linéaire, exacte- 
ment comme dans l’exemple précédent. 

On peut aussi identifier C avec R? de la manière ha- 
bituelle; on le voit alors comme un espace vectoriel de 
dimension 2 sur K = R. La même application f est tou- 
jours linéaire, bien sûr, quand on la voit comme une fonc- 
tion R? — R?. On l'appelle la rotation d'angle 9, ce qui doit 
correspondre à l’idée de rotation que vous avez étudiée au 
collège ou au lycée. 


ExeMPLE 15.4 - Voyons un exemple plus abstrait. Prenons 
E ={ $: R >R dérivable }, 
l'espace vectoriel des fonctions dérivables, et 
F= F(R,R), 


l’espace vectoriel de toutes les fonctions R > R. Alors on 
peut définir une application f : E > F par f (f) = p’. Cette 
application f est linéaire, car (+1) = b’+4 et (Ab) = Ab’ 
pour toute constante À (cf proposition 6.5). 


DériniTION 15.5 (Er PrROPOSITION) - Soit f : E > F linéaire. On 
définit son noyau ker( f) comme étant 


ker(f)={v eE] f(v) = 0}. 
On définit l’image de f, notée Im( f), par 


kernel en 


anglais = noyau 


Im(f)={w €F | il existe v € E tel que w = f (v)}. 


On utilise aussi la notation f (E) pour Im(f). 

Alors ker(f) et Im( f) sont des sous-espaces vectoriels (de E 
et F respectivement). 

La dimension de Im(f) est appelée le rang de f. 


La vérification que ker(f) et Im(f) sont bien des sous- 
espaces vectoriels vous est laissée. 


ExEMPLE 15.6 -Prenons f(v) = Av comme dans 
l'exemple 15.2. Alors ker(f) est l’ensemble des v tels 
que Av = 0 : c’est l’ensemble des solutions d’un système 
linéaire. Réciproquement d’ailleurs, étant donné un 
système, on peut considérer sa matrice et l'application 
linéaire correspondante, dont le noyau est l’ensemble des 
solutions. 


Avant de regarder Im(f) pour le même f, notons un résultat 
simple : 


LEMME 15.7 — Soit f: E — F linéaire. Si E = Vect(e,,...,e„), 
alors Im( f ) = Vect( f (e1),..., f (e„)). 


Démonstration. Chaque f(e;) est dans Im(f) par définition, 
donc Vect(f(e,),..., f(e„)) C Im(f). Réciproquement, si w = 
f (v), alors on écrit v = À, e, +++: + À,e,, ce qui est possible par 
hypothèse, et on applique f : 


w = f (v) = f (Mes ++ Anen) =d f (ei) +-+ Anf (en). 


Ceci montre bien que w € Vect(f (e1),..., f (e„)). 


ExEMPLE 15.8 -Reprenons encore f: K" => K" défi- 
nie par f(v) = Av comme dans l'exemple précédent, et 
intéressons-nous à Im(f). 

On peut prendre la base canonique e,,...,e„ de K", et 
par le lemme on sait que Im(f) = Vect(f (e1),..., f (e„)). Or 
on a 


f(e;) = Ae; = AÏ 1 |= la i-ème colonne de A. 
0 


Donc Im(f) est l’espace engendré par les colonnes de A, 
c'est-à-dire que Im(f) = Vect(A). En particulier, par dé- 
finition même le rang de f coïncide avec le rang de A 
(rappelez-vous la définition 14.40). 


Ces deux derniers exemples montrent que les deux grands 
types de sous-espaces de K" qui nous sont familiers, à savoir 
ceux définis par des équations et ceux donnés comme des vects, 
peuvent être vus comme des noyaux ou des images d’applica- 
tions linéaires. Comprendre les applications linéaires permet 
donc de comprendre bien des choses. 


ExEMPLE 15.9 - Reprenons l'application f (p) = |@' comme 
dans l'exemple 15.4. Le noyau de f est constitué des fonc- 
tions | telles que p’ = 0; d’après le théorème des accrois- 
sements finis, ceci revient à dire que est constante. 

L'image de f est l’ensemble des fonctions w qui sont de 
la forme 1 = db’. En d’autres termes il s’agit des fonctions 
qui possèdent une primitive. Peut-on décrire facilement 
cet espace vectoriel ? C'est une question très difficile ! Dans 
le chapitre suivant nous montrerons au moins que toutes 
les fonctions continues possèdent une primitive (mais ça 
n'est qu’une description partielle de Im(f) bien sûr). 


voir les exercices 
929, 5188 


SOMMES DIRECTES 
[D] 


Nous souhaitons décrire deux types d'applications linéaires 
très courantes et de nature géométrique, les projections et les 
symétries. Ce sont des généralisations des projections et symé- 
tries « orthogonales » que vous aviez vues au collège. Pour pré- 
parer correctement la version la plus générale, il nous faut exa- 
miner un peu les relations qu’il peut y avoir entre deux sous- 
espaces d’un espace donné. 

On part donc d’un espace vectoriel E, et on prend deux 
sous-espaces U et V. On peut tout d’abord considérer l'inter- 
section U N V, constituée des vecteurs qui sont à la fois dans U 
et dans V : vous vérifierez sans peine que c’est encore un sous- 
espace vectoriel. Une autre opération possible est la suivante. 


DériniTIoN 15.10 - La somme des sous-espaces U et V de E, no- 
tée U + V, est l'ensemble des vecteurs de E de la forme u + v 


avecueUetvevV. 


Là encore, c'est un sous-espace vectoriel de E. 


ExEMPLE 15.11 - Lorsque U et V sont donnés par des équa- 
tions, décrire U N V est facile. Par exemple dans E = R3, 
si U est décrit par les équations 


48 0 


x + 3y + 352 = 0 


et si V est décrit par l'équation x-z =0, alors UNV est l'en- 
semble des vecteurs dont les coordonnées vérifient toutes 
ces équations à la fois. En clair UN V est décrit par 


3x = Y + ë = 0 
X + 3y + 5z = 0 
x = Z => Ü 


Si maintenant U et V sont donnés comme des vects, 
c'est U + V qui est facile à décrire. En effet, les définitions 
entraînent immédiatement que 


Vect(u1,...,un)+Vect(vi,...,Vn)= Vect(u,..., Un, V1,..., Um). 


(Vérifiez-le.) 

Si maintenant on souhaite décrire U N V pour U et V 
donnés comme des vects, ou U + V pour U et V donnés par 
des équations, la seule solution est de faire d’abord une 
traduction des équations aux vects ou vice-versa, comme 
on sait le faire. 


Il existe une relation simple entre les dimensions de UN V 
et U+V: 


ProposirioN 15.12 - Soient E un espace vectoriel et U,V deux 
sous-espaces de dimension finie. Alors U + V et UN V sont de di- 
mension finie, et on a 


dim(U + V) = dim(U) + dim(V)-dim(U n V). 


Démonstration. Puisque UNV est un sous-espace de U, il est de 
dimension finie par le corollaire 14.39. Prenons donc une base 
de UN V, disons e4, €2,..., eg. 

D’après le théorème de la base incomplète (14.37), on peut 
trouver u, u2,..., Up E U tels que By = €1,..., Cd, Uj,..., Up Est 
une base de U. De même, on peut trouver v,,...,v, € V tels 
que By = e1,..-, €q, V1,...,Ve est une base de V. Montrons que 


B = e4,..., €d Ure. Uk V1,..., VE 


est une base de U+V. Ceci montrera que U+V est de dimension 
finie, et que sa dimension est d +k + € = (d + k) + (d + £) - d = 
dim(U) + dim(V) -dim(U N V), comme prévu. 

Pour commencer, puisque U = Vect( By) et V = Vect( By), il 
est clair que U + V = Vect( B) (voir l'exemple précédent). Donc 
ØB est génératrice. Pour montrer qu'elle est libre, nous devons 
étudier l'équation 


a] ej +: + Aged + Biu ++ Peu + Y1V1 ++ yeve = 0, 
que nous réécrivons 

aje ++ Aged +B1 11 +++ Prug =-(Y1V1 +: + Yeve). 
Le membre de gauche appartient à U et le membre de droite 
appartient à V; pour qu'ils soient égaux, il faut donc qu'ils 
appartiennent tous les deux à U N V. L'espace U N V ayant 
pour base e,,..., eg, les deux membres de la dernière équation 


doivent donc être de la forme je; +:--:+ geg pour certains 
scalaires À;. Écrivons en particulier 


(NV ++ + Veve) = Me ++ geq, 
ou encore 
Me H> +HAgeg + YY +H >>> + Yeve = 0. 


La famille Zy étant libre, tous les coefficients ci-dessus sont 
nuls : A =+ = Àq = Yı => = 0. Si nous revenons à l’équa- 
tion de départ, il ne reste plus que 


ap ej ++ Aged + Biu ++ Peug = 0. 


Et finalement, la famille Zy étant libre, ces derniers coeffi- 
cients sont également nuls : a = + = ay = B =+ = Bk = 0. 
La famille Z est bien libre. 


CoroLLAIRE 15.13 — Soit E un espace vectoriel de dimension fi- 
nie, et soient U,V deux sous-espaces. Alors, lorsque deux des trois 
conditions ci-dessous sont remplies, la troisième l’est également : 


1. UNV = {0} 
2. E=U+V, 
3. dim(U) + dim(V) = dim(E). 


Démonstration. Il faut simplement se rappeler les choses sui- 
vantes : si F est un sous-espace de E, alors F = E => dim(F) = 
dim(E) (corollaire 14.39); en outre F = {0} => dim(F) = 0. 
Donc on peut réécrire les trois conditions de la façon suivante : 

1. dim(UNV)=0, 

2. dim(E) = dim(U) + dim(V) - dim(UNV), 

3. dim(U) + dim(V) = dim(E). 
(On a utilisé la proposition pour le (2).) Il est maintenant clair 
que si deux égalités sont vraies, alors la troisième aussi. 


DÉFINITION 15.14 — On dit que E est la somme directe de U et V, 
et on écrit E = U@ V, lorsque l'on a UN V = {0} et E=U +V. 


On dit parfois aussi que U et V sont supplémentaires dans E 
(ou encore que V est un supplémentaire de U dans E). Atten- 
tion à ne jamais dire « complémentaire » ; attention aussi à ne 
pas parler « du » supplémentaire comme s'il était unique, ce 
n'est pas le cas. 

Le corollaire indique donc que, dans le cas de la dimension 
finie qui est celui que nous rencontrons presque toujours, on 
peut vérifier si E = U @ V de plusieurs façons. Typiquement, 
vérifier si E = U + V peut être plus difficile que de vérifier les 
deux autres conditions du corollaire. 


ExEMPLE 15.15 — Prenons E = R3, puis U défini par l'équa- 
tion 2x- y + 7z = 0, et enfin V = Vect(v) avec 


1 
v=| 1 
2 


Alors dim(U) = 2 (on peut prendre y et z comme para- 
mètres), et dim(V) = 1, donc dim(U) + dim(V) = dim(E). 
D'après le corollaire, pour vérifier que E = U @ V il suffit 
de montrer que UN V = {0}. Ceci nous évite de montrer 
directement E = U + V, ce qui est un peu plus pénible. 

Un vecteur de V est de la forme 


Av=| À |, 
2À 
avec À E R. Ce vecteur est dans U lorsque 
21-1+7x21=151=0. 


Ceci n'arrive que pour À = 0, donc le seul vecteur à la fois 
dans U et dans V est le vecteur nul. On a bien UN V = {0}, 
et finalement E= UQV. 


ExEMPLE 15.16 - Une situation très simple est celle d'un es- 
pace vectoriel E muni d'une base e,,...,e„, dans lequel on 
choisit de « couper en deux » ces vecteurs, en posant U = 
Vect(e:,...,er) et V = Vect(et,1,...,en). Dans ce cas il est 
clair que E = U @ V, les deux conditions les plus faciles 
à vérifier étant E = U + V et dim(U) + dim(V) = dim(E). 

Il y a même une sorte de réciproque. Si E = U @V, pre- 
nons une base u1,..., up de U et une base v, ,..., vy de V, et 
considérons Z = u1,..., Uk, V1;... vp. Alors H est une base 
de E, le plus facile étant de repérer que c'est une famille 
génératrice ayant k + € = dim(E) éléments. 


La meilleure façon de comprendre de manière intuitive et 
géométrique les sommes directes reste d'étudier les projections, 
ce que nous allons faire maintenant. 


voir les exercices 
6871, 920, 923 


PROJECTIONS ET SYMÉTRIES 
mMM] 


De même que les bases nous permettent de prendre des co- 
ordonnées, les sommes directes vont nous permettre de décom- 
poser les vecteurs. En effet, supposons que E = U@ V, et pre- 
nons x € E. Puisque E = U + V, on peut trouver u € U et v € V 
tels que x = u+v. Mais de plus, u et v sont uniques. Pour vérifier 
ceci, écrivons x = u’ +v’ avec u’ E U et v’ E V, puis 


On a u-u’ € U et v’ -v € V, donc pour que ces vecteurs soient 
égaux, il faut qu'ils soient dans U N V = {0}. Ainsi u - u’ = 0 = 
v' =v et donc u =u’, v =v. 

Les vecteurs u et v sont bien définis par x; on pourrait les 
noter uy et vy. Nous allons pouvoir étudier la fonction qui à x 
associe Uy : 


DÉFINITION 15.17 -Supposons que E = U @ V. La projection 
sur U, parallèlement à V, est l'application 


jae JH => 18] 


définie par p(x) = uy, où x = uy + Vy (comme ci-dessus). 


ExEMPLE 15.18 — Prenons E = R?, et choisissons une 
base e1,e. Enfin, posons U = Vect(e,) et V = Vect(e;), de 
sorte que E = U @ V comme dans l'exemple 15.16. Soit p 
la projection sur U, parallèlement à V. La situation se pré- 
sente comme sur le dessin suivant; on a indiqué x et p(x) 
pour un choix de x arbitraire. 


La construction se fait en prenant la parallèle à V pas- 
sant par x; l'intersection de cette droite avec U est p(x). 


ProposiTION 15.19 — Soit p comme ci-dessus. Alors 
1. p est linéaire, 


2. p(p(x)) = p(x), 
3. le noyau de p est V, l’image de p est U. 


Réciproquement, si p est une application de E vers lui-même 
vérifiant (1) et (2), alors on a 


E=Im(p)@ker(p), 


et p est la projection sur Im(p) parallèlement à ker(p). 


Sur la figure précédente, essayez de voir géométriquement 
pourquoi V = ker(p) et U = Im(p). 


Démonstration. Si x= u +v et y = u’ +v’, alors x+y = (u + u’) + 
(v +v’) avec u +u’ € U et v + v' € V, donc par définition p(x + 
y) = u + u', avec u = p(x) et u’ = p(y). On montre de même 
que p(Ax) = Ap(x). La projection p est bien linéaire. 

En écrivant x = u + v comme ci-dessus, on a p(x) = u € U. Si 
l’on écrit u = u + 0, alors c’est la décomposition de u sur U et V 
et par définition p(u) = u. Ainsi p(p(x)) = p(x). Les points (1) et 
(2) sont montrés. 

Passons au (3). Si x = u +v et si p(x) = u = 0, alors x =v E V ; 
donc ker(p) € V. Réciproquement si x € V, on écrit x = 0 + x = 
u +v pour constater que u = 0 = p(x) (et v = x), donc x € ker(p) 
et finalement ker(p) = V. L'image de p est clairement contenue 
dans U, et réciproquement si on prend u € U, en l’écrivant u = 
u + 0 on voit (comme ci-dessus) que p(u) = u donc u € Im(p). 
L'image de p est bien U. 

Voyons la réciproque, et supposons que p est linéaire de E 
vers E, avec p(p(x)) = p(x). Si on prend x € E quelconque, on 
écrit simplement 


x = p(x) + (x = p(x)). (©) 


Bien sûr p(x) € Im(p), et comme p(x - p(x)) = p(x) - p(p(x)) = 
p(x)-p(x) = 0, on a x-p(x) € ker(p). Ceci montre que E = Im(p)+ 
ker(p). 

Pour établir que la somme est directe, prenons x € ker(p) N 
Im(p). Alors p(x) = 0 puisque x € ker(p). D'autre part x = p(y) 
pour un certain y, donc p(x) = p(p(y)) = p(y) = x. En comparant 
les deux on voit que x = 0, et ker(p)NIm(p) = {0}. La somme est 
bien directe. 

Enfin l'équation (*) montre bien que la projection de x 
sur Im(p) parallèlement à ker(p) est p(x). 


Après les projections, les symétries. Cette fois-ci, au lieu de 
remplacer v, par 0, on le remplace par -v.. Plus précisément : 


DÉFINITION 15.20 — Supposons que E = U@ V. La symétrie par 
rapport à U, dans la direction V, est l'application 


s: E— E, 


définie par s(x) = Uy — Vy, où x = Uy + Vy (comme ci-dessus). 


ProposiTION 15.21 — Soit s comme ci-dessus. Alors 
1. s est linéaire, 
2, AA 


3. on peut caractériser U et V par 
U=fen|di=, 


Ef 
V =[x eE | s(x) =-x}. 


Réciproquement, si s est une application de E vers lui-même vé- 
rifiant (1) et (2), et si on définit U et V par les égalités ci-dessus, 
alors E =U @ V et s est la symétrie par rapport à U, dans la direc- 
tion V. 


Démonstration. On vous laisse montrer les trois points, à titre 
d'exercice. Montrons la réciproque : on prend s linéaire telle 
que s(s(x)) = x et on définit U et V par les égalités proposées. 
Écrivons 


En posant u, = $ (x+ s(x)) et v, = $ (x-s(x)), on a donc x = 
u,+v,. De plus 


sus) => (s(x) + s(s(x))) = > (s(x) +) = 18, 
donc ux € U par définition. Un calcul similaire donne s(v,) = 
—Vy, Soit vy € V. Ceci montre que E =U + V. 

Si x € UNV, alors s(x) = x = =x, donc 2x = 0 et x = 0. Par 
suite UN V = {0}, et E=U@V. 

Enfin s(x) = su, + Vy) = uy — Vy, donc s est bien la symétrie 
annoncée. 


voir les exercices 
5565, 970, 974 


LA MATRICE D'UNE APPLICATION LINÉAIRE 
mm 


Nous avons vu qu'une matrice À € M,,,(K) définissait une 
application linéaire f de K" vers K” par f (v) = Av. Nous allons 
voir maintenant que, réciproquement, si f: E — Fest linéaire, 
on peut lui associer une matrice une fois que des bases ont été 
choisies pour E et F. 

Supposons donc que H = e1,...,e, est une base de E, et 
que Œ = £1,..., Em est une base de F. Le lemme suivant contient 
une observation simple : pour définir une application linéaire 
dans cette situation, il suffit de spécifier chaque f (e;). 


Lemme 15.22 — Soient v,,...,v„ des vecteurs quelconques de F. 
Alors il existe une application linéaire f : E — F et une seule telle 


que f (ei) = vi. 


Démonstration. Voyons l'unicité d'abord. Prenons u € E, que 
l'on peut écrire u = à, ej + >> + Anen. On doit avoir 


f(u) =d; f (ei) ++ Anf len) 


= QV +> + Ànn. (*) 


Il n'y a donc qu’un seul choix possible pour f(u), et f est 
unique si elle existe. 

Pour vérifier l'existence, on définit f par la formule (+), et on 
doit simplement vérifier qu'elle est linéaire. C’est très facile, et 
on vous le confie à titre d'exercice. 


Exploitons maintenant le fait que nous avons aussi choisi 
une base X pour F. En effet, pour spécifier f (e;), il suffit désor- 
mais de donner ses coordonnées dans Œ ; c’est-à-dire que l’on 
peut écrire 


f(ei) = ai ej +Gazj E82 ++ Ami Em» 


et l'application f est déterminée par les nombres 4;;. C'est la 
matrice (4;;) que l'on appelle la matrice de f, par rapport aux 
bases Z et 6. 


En d'autres termes : 


DérFinitIoN 15.23 -Soit f: E > F une application linéaire, 
soit P = e,,...,e, une base de E, et soit X une base de F. Alors 
la matrice de f dans les bases B et C, que l'on va noter 


CTI 


est construite de la manière suivante : dans la colonne i, on 
place les coordonnées de f(e;) dans la base C. 
Lorsque les bases sont évidentes d’après le contexte, on va 


écrire [f] plutôt que lee 


ExEMPLE 15.24 - Prenons E = F = R?, et 


3 _f -1 
a EZE 
Alors Z = e,,e est une base de R?. On pose U = Vect(e;) 
et V = Vect(e2), de sorte que R? = U @ V. Soit maintenant p 
la projection sur U, parallèlement à V. 
Il y a au moins deux questions naturelles que l'on peut 
poser. Tout d'abord, quelle est 


glp)” ? 


(On dira «la matrice de p dans la base P » pour indiquer 
que l'on prend Œ = B.) Pour cela, on revient à la défini- 
tion. Dans la colonne 1, on écrit les coordonnées de p(e,) 
dans la base Ø. On a p(e1) = e} = 1 x ej +0 x ez, donc la 
première colonne est 
1 
(o) 


Dans la colonne 2, on indique les coordonnées de p(e2). Or 
p(e2)=0=0xe; +0 x ez, donc la deuxième colonne est 


(o) 
aim? =( 3 0] 


Maintenant, avec R? il est naturel de penser à la base 
canonique Ó = £4, £2 avec 


Finalement 


Quelle est donc = 
glp)” ? 


Il faut calculer p(e,) et p(e>), dans la base canonique, et 
ceci nous donnera les deux colonnes de la matrice que l’on 
cherche. Prenons donc un vecteur quelconque 


On va calculer ses coordonnées dans la base Z, puisque 
c'est avec cette base que l’on sait bien faire des calculs 
avec p. Pour cela introduisons 


3 -1 
A= , 
la matrice dont les colonnes sont les vecteurs de Z. On a 
alors 
X1 | _ | 2x + Lx | 
X2 -} X1 + È x. 


(Revoir l'exemple 14.27 si ce n'est pas clair.) En particulier 


on obtient donc 
| glez] = | | s 


On a donc €; = Ze — Le), ce qui permet de calculer que 


SI Sdn 


1 
als] =A?"x=| A 
7 


alal =( _ 


SIJ Sain 
SION 


EIs as 7 she 
P\E1) = Z Ci = 2 = 781 tre: 


1 3 3 1 
= = 7 = —£€ — y 
P(E2) e | 1 | 7 1 + 7 22 


Finalement 
g 6 3 
am =( 3 3). 


Pour vérifier si vous avez assimilé les définitions, assurez- 
vous que vous comprenez maintenant pourquoi 


sp =(? o) œ apr =( 7 3) 


Si vous trouvez cet exemple difficile à suivre, alors vous ap- 
précierez la « formule du changement de base » que nous al- 
lons présenter très bientôt. C'est une formule simple et sys- 
tématique pour organiser les calculs ci-dessus, mais il faudra 
toujours être capable d'écrire au moins une matrice (pour cer- 
taines bases), la formule donnera les matrices dans les autres 
bases. Dans l'exemple, le plus simple est de commencer par 


ali? =| | : | 


Nous commençons d’ailleurs avec cet exemple à voir l’inté- 
rêt de toutes ces matrices : puisqu'elles contiennent toutes la 
même information, à savoir une description de l'application p, 
libre à nous de choisir la plus simple. Et vous voyez bien 
que glp]? est beaucoup plus simple que les autres ! Cette idée 
sera « poussée » dans le chapitre « Diagonalisation ». 

Commençons par constater, avec la proposition suivante, 
que toutes les applications linéaires (entre espaces vectoriels de 
dimension finie) se ramènent à multiplier une matrice par un 
vecteur-colonne ; et la composition des applications se ramène 
à multiplier les matrices. 


ProposirioN 15.25 — Soient E, F et G des espaces vectoriels, et 
soient B, C et D des bases de ces espaces respectifs. 


1. Si f: E => F est linéaire, et si x € E, alors [f(x)] = [f][x]. 
Plus précisément 


elfo] = elf] æl]. 


2. Si g: F => G est linéaire, alors |g o f] = [g][f]. Plus précisé- 


ment 
algo f]? = ols e]. 


Les détails de la démonstration, qui consiste seulement à 
vérifier les définitions, vous sont laissés à titre d'exercice. Pre- 
nez le temps de le faire, et de vous convaincre que c’est précisé- 
ment pour avoir ce résultat que lon a défini la multiplication des 
matrices comme on l'a fait. 


ExEeMPLE 15.26 — Reprenons l'exemple précédent. Nous 
avons calculé 


Ceci nous permet de calculer l’image d’un vecteur quel- 
conque par l'application p (dans la base canonique). En ef- 


fet si 
x 
z A ) rt, 


NINNIO 
NINI% 


M =«[p]* -| 


alors 


6 3 
pla) =w [pd] el eM 3217 122 |. 


En d'autres termes, l'application p n'est autre que p(x) = 
Mx. Au départ il n'était pas clair à partir de la définition 
« géométrique » de la projection que l'on puisse l'écrire 
simplement avec une matrice. 


voir les exercices 
2740, 2741 


FORMULE DU CHANGEMENT DE BASE 
o_a] 


Nous allons voir comment passer de la matrice d’une ap- 
plication linéaire, écrite dans certaines bases, à la matrice de la 
même application écrite dans d’autres bases. Notre point de dé- 
part est donc celui d’un espace vectoriel E muni de deux bases, 
disons Z = e;,...,e,et C =€E1,..., En. 


DÉFINITION 15.27 - La matrice de passage de Z à €, que l’on 
va noter 
TÉ 


v 


est la matrice obtenue de la manière suivante : dans la co- 
lonne i, on place les coordonnées de e; dans la base C. 


(On a signalé à l'auteur que dans certains livres, ce que nous 
notons œP” est appelé « matrice de passage de € à P », donc 
en inversant les rôles de & et Œ. Méfiance donc en lisant un 
énoncé d'exercice de provenance suspecte. L'important, bien 
sür, est d'associer correctement une notation avec une défini- 
tion, donc &PŸ avec la définition ci-dessus par exemple.) 


ExEMPLE 15.28 - Reprenons l'exemple 15.24, et conservons 
les notations. On a alors 


3 -1 
7 pZ = A 
En effet cette matrice contient bien dans la colonne 1 le 
vecteur e} de Z, écrit dans la base canonique ©, et de 
même la colonne 2 contient e2. 
Pour calculer PÉ, on doit placer dans la colonne 1 le 


vecteur-colonne [€], et dans la colonne 2 on place ge]. 
Nous avons fait ces calculs dans l'exemple, et finalement 


on a 
art =| | 


ProPosirion 15.29 — Les matrices de passage ont les propriétés sui- 
vantes : 

1. gP? = Id (matrice identité). 
pÉ = pa, 


SU Salno 
SION 


2 gP Z 
3. gP? = (cr). 


Démonstration. Le premier point est évident d’après les défi- 
nitions. Pour le deuxième, le plus simple est de noter la chose 
suivante : si 1: E > E est l'application 1(x) = x, alors les défini- 
tions entraînent que 


gr =u, 


On exploite ensuite le fait que 1(1(x)) = x donc 1o 1 = ı et par 
suite, en utilisant la proposition 15.25 : 


B B B E B C pB 
xP? =g" =g[101]7 =g] el = gP gP. 
Le troisième point est maintenant facile, puisque l’on a 
gP gP? = gP? =Id, 


donc les matrices @P? et gP% sont bien inverses l’une de 
l’autre, comme annoncé. 


Voici maintenant la formule proprement dite : 


PropPosirion 15.30 — Soit f : E => F linéaire, soient B et B’ deux 
bases de E, et soient 6 et 6” deux bases de F. Alors 


el =e. elf] g7. 


Cette formule est plus facile à mémoriser qu'il n’y paraît. Il 
suffit de se rappeler qu'il faut « mettre » des matrices de pas- 
sage à gauche et à droite ; ensuite, pour écrire les bonnes bases, 
il suffit de s'assurer d’abord que les bases apparaissant côte-à- 
côte sont les mêmes (ci-dessus, on a écrit H deux fois, côte-à- 
côte, et de même pour G); enfin, les bases « à l'extérieur » des 
formules (donc B’ et G’) sont les mêmes des deux côtés de 
l'égalité. 


Démonstration. On utilise la même astuce. Soit ıp: E > E l'ap- 
plication 1p(x) = x, et soit ıp défini de la même manière. On 
a 1r(f(1(x))) = f (x), donc Ip o f o 1p = f, ce qui donne en termes 
de matrices (en utilisant la proposition 15.25) : 


GUTZ =elrof or]? = 
elir elf] alel =P elf] gT, 


i É 4 B 
puisque el] = PE et gli] = gP?. 


ExeMPLE 15.31 — Reprenons l'exemple 15.24 : les choses 
vont être maintenant beaucoup plus simples. Il s’agit donc 
de la projection p: R? => R? sur U = Vect(e,) parallèlement 
à V = Vect(e)). Dans la base Z = e;,e>ona 


adf l 4 6) 


puisque p(e,) =e, et p(e2) = 0 (pour l'instant les vecteurs e, 
et e particuliers que l'on choisit ne changent rien à l'af- 
faire). Si maintenant on considère la base canonique C et 
que l'on veut la matrice de p dans cette base, on utilise la 
formule du changement de base : 


«[p]* =É P?g[p]?g@P*. 


Dans l'exemple 15.28, nous avons vu que 
B _ 3 -1 
ce | 1 2 | j 


, -1 
Pour l’autre, on utilise le fait que gP? = (e pæ) . Nous 


| 


avons déjà fait ce calcul, et on trouve 


a“ =| 


SID Sa n 


SION 


Ce qui donne bien 


e(o NÉ 5) À) 


On peut traiter sans peine le cas de la projection s par 
rapport à U, dans la direction V. En effet on a s(e,) = e, 
et s(e>) = —e2, donc 


SUE Salno 
NINNIO 
NISNI% 


TE 1 2) 


Dans la base canonique, on introduit exactement les 
mêmes matrices de passage, donc 


CAD 4) 24 HH 


Ce qui signifie que pour trouver l'image d'un vecteur quel- 
conque par cette symétrie, on peut calculer simplement 


5 6 
$ X1 = xX] = 7 + 732 
X2 X2 7 X1 — 7 X2 


NIONIA 


NIANI 


- Fin de la première lecture — 


voir les exercices 
2433, 3400, 
5259 


APPLICATIONS INJECTIVES, SURJECTIVES, BIJECTIVES 
RE 


Le lecteur est invité à revoir les définitions des termes « in- 
jectif », « surjectif », et « bijectif », introduits dans le tout pre- 
mier chapitre de ce livre. 

Nous allons examiner ces concepts dans le cadre des ap- 
plications linéaires. Il se trouve que la situation est bien plus 
simple que dans le cas général. Commençons par : 


Lemme 15.32 — Soit f: E — F linéaire. Si f possède une réci- 
proque f! : FE, alors f `` est également linéaire. 


Démonstration. Prenons u et v dans F, et soit x = f !(u + v). 
On a f(x) = u+v = f (f 1(u)) + f (f 1(v)) = f(f1(u) + f 1(v)) 
puisque f est linéaire. En appliquant f-!, on obtient x = 
f (u)+f !(v) =f '(u+v). On vous laisse montrer de la même 
manière que f "(Av) =Af-!(v). 


On utilise un mot savant pour les applications bijectives et 
linéaires : 


DÉFINITION 15.33 - Une application linéaire et bijective est ap- 
pelée un isomorphisme. Lorsqu'il existe un isomorphisme E > 
F, on dit que E et F sont isomorphes. 


Ce nouveau nom ne doit pas cacher un vieux calcul : 


Proposirion 15.34 — Soit f : E — F linéaire, soit B une base (fi- 
nie) de E, et soit € une base (finie) de F. Alors f est un isomor- 


phisme si et seulement si la matrice Jf] est inversible. De plus 
la matrice de la réciproque f`! est l'inverse de la matrice de f. 


Ce qui veut dire que l'on peut se ramener à un calcul de 
déterminant. 


Démonstration. Si f7! existe, on note que f-!(f(x)) = x donc la 
matrice de f! o f dans la base Z est l'identité. Ainsi 


= B _11C 
Id =g[f tof] =al "| er. 
De la même manière, on montre dans l'autre sens que 
116 
elfaj] =1, 
ce qui montre que 
1] -1 
al '| =en) `. 
Réciproquement, si la matrice de f est inversible, on définit 
M=É[f]# et N=M'!, 


et on écrit g pour l'unique application F — E dont la matrice 
est 


ælgl* =N. 


Les relations MN = NM = Id entraînent g(f (x)) = x et f (g(x)) = 
x, donc g = f™!. 


Une matrice inversible se doit d’être carrée, donc citons tout 
de suite : 


COROLLAIRE 15.35 - Deux espaces de dimension finie E et F sont 
isomorphes => ils ont la même dimension. 


Démonstration. Pour toute application linéaire f: E — F, sa 
matrice est de dimension m x n, avec n = dim(E) et m = dim(F). 
S'il en existe une qui est bijective, alors sa matrice doit être car- 
rée, donc n = m. Réciproquement si n = m, prenons n'importe 
quelle matrice A inversible de taille n x n (par exemple l’iden- 
tité), prenons une base Z de E et une base C de F, et enfin 
prenons f l'unique application linéaire f : E > F telle que 


elf]? =A. 


C'est un isomorphisme d’après la proposition. 


ExEMPLE 15.36 — Prenons r: R? => R? la rotation d'angle 6 
autour de l'origine. Rappelons qu'en identifiant R? avec le 
plan complexe C, on a r(z) = e?z. Choisissons la base Z = 
1,i. On a r(1) = e® = cos(0) + isin(0), et r(i) = ie = 
-sin(0) + i cos(0). Par définition on a donc 


Le déterminant de cette matrice est cos(0)? + sin(0)? = 1 + 
0, donc elle est inversible et son inverse est 


cos(@) sin(@) 
—sin(@) cos(0) 


Donc r est bijective et sa réciproque est donnée par la ma- 
trice ci-dessus dans la base P. Puisque cos(-0) = cos(0) 
et sin(—0) = -sin(8), on peut réécrire 


On constate que la réciproque de r est la rotation 
d'angle -0, ce qui est normalement évident du point de 
vue géométrique. 


Les conditions de surjectivité et d’injectivité se vérifient 
également facilement. On a d’abord : 


PropPosirion 15.37 - Une application linéaire f : E > F est surjec- 
tive => le rang de f vaut dim(F). 


Démonstration. Tout est dans les définitions. On a f surjective 
< Im(f) =F © dim(Im(f)) = dim(F), et bien sûr dim(Im(f)) 
est par définition le rang de f. 


ExeMPLE 15.38 - Une application linéaire f: R? — R° ne 
peut pas être surjective. En effet, si A désigne la matrice 
de f dans les bases canoniques, alors f(v) = Av et le rang 
de f est le rang de la matrice A. Or le rang d’une matrice 3x 
2 ne saurait être égal à 3. 


Pour l’injectivité, le résultat suivant est très utile : 


PropPosirioN 15.39 — Une application linéaire f est injective => 
on a ker(f) = {0}. 


Démonstration. Si f est injective, alors pour x € ker(f) on a 
f(x) = 0 = f(0) donc x = 0, et ker(f) = {0}. Réciproquement, 
supposons que ker(f) = {0}. Si f(x1) = f(x2), alors f(x; — x2) = 
f(x) — f(x2) = 0, donc xı - x: € ker(f), d'où x; = x2, et f est 
bien injective. 


ExEMPLE 15.40 - Voici la traduction en termes de matrices. 
Prenons f: K" => K” définie par f(v) = Av pour une ma- 
trice A. Alors les éléments v de ker(f) sont les solutions du 
système linéaire Av = 0. 

Dire que ker(f) = {0}, c'est affirmer que ce système n’a 
que la solution nulle. On s'aperçoit alors que l’injectivité 
de f revient à exiger que les colonnes de A forment une fa- 
mille libre. 

En particulier, c'est impossible pour n > m (théo- 
rème 14.30), et il n’y a aucune application linéaire injec- 
tive R? => R? par exemple. 


On voit que des considérations simples sur les matrices 
nous permettent de faire des liens entre l’injectivité ou la sur- 
jectivité d’une application linéaire et les dimensions des es- 
paces qui sont en jeu. En fait il y a une façon très simple et 
très générale de résumer toutes ces relations, qu’il faut retenir : 
c'est le «théorème du rang » que nous présentons maintenant. 


voir l'exercice 
956 


LE THÉORÈME DU RANG 
[5] 


C’est le suivant : 


THÉORÈME 15.41 — Soit f : E > F une application linéaire, et sup- 
posons que E est de dimension finie. Alors Im(f) est de dimension 
finie, et on a 


dim(E) = dim(ker(f))+dim(Im(f)). 
Démonstration. Soit e1,...,e; une base de ker(f). Par le théo- 
rème de la base incomplète, on peut trouver £,,...,e, tels que 
la famille Z = ê4,...,ep,€1,...,€@ est une base de E. Posons f; = 
f(a), et montrons que la famille X = fj,..., fe est une base 
de Im( f). Comme dim(E) = k + €, le théorème sera établi. 


Si y € Im(f), par définition y = f(x) pour un certain x € E, 
et on peut écrire 


x= Me ttt per + ME ++ Hee, 
d’où 
y = f(x) = pf (&1)+ + pef (ee) = pfi ++ pefe 


(car f (ei) = 0 bien sür). Donc C est génératrice de Im(f). 
Si maintenant on a une combinaison linéaire nulle : 


pifi ++ pefe = 0 = pi f(e1) +> + pef (er) = f (p181 +: + peee), 


on en conclut que pe, +> + yes € ker(f). Nous avons une 
base de ker(f) à notre disposition, écrivons donc qu'il existe 
des scalaires \,..., Àp tels que 


PEL ++ pes = Ae ++ AKEk. 


On en déduit 


Mej ++ Age Mie >>> eee = 0, 
et comme SZ est une base de E, on a finalement À =- = Àp = 
p =+ = y = 0. En particulier, la famille € est libre. 


ExeMPLE 15.42 - Pour une application f : K” => K”, de la 
forme f(v) = Av, où A est une matrice, ce théorème dit 
une chose bien concrète en termes du système Av = 0. 
En effet dim(E) = n est le nombre d’inconnues en jeu, 
dim(ker(f)) est le nombre (minimal) de paramètres néces- 
saires pour décrire l’ensemble des solutions, et dim(Im(f)) 
est le rang de la matrice A. On a donc 


| nombre ) =| nombre de | | rang de | 


d’inconnues paramètres la matrice 


Avec un peu d'expérience vis-à-vis des systèmes, ça n’a rien 
de surprenant. Il est toutefois appréciable d’avoir une for- 
mulation très précise de cette égalité - par exemple la no- 
tion de dimension d’un espace vectoriel rend précise l’idée 
de nombre minimal de paramètres nécessaires pour dé- 
crire les solutions. 


Le théorème du rang a de nombreuses conséquences immé- 
diates. 


CoRoOLLAIRE 15.43 — Soit f : E => F linéaire. Alors 
1. Si f est injective, on a dim(E) < dim(F). 
2. Si f est surjective, on a dim(E) > dim(F). 


3. Si f est un isomorphisme, on a dim(E) = dim(F). 


Nous avions observé ces phénomènes un peu plus haut, 
mais la démonstration est maintenant plus directe : 


Démonstration. Si f est injective, alors dim(ker(f)) = 0 
(proposition 15.39), d'où dim(E) = dim(Im(f)) < dim(F) 
puisque Im(f) est un sous-espace de F. 

Si f est surjective, alors dim(Im(f)) = dim(F) = dim(E) - 
dim(ker(f)) < dim(E). 


Le prochain résultat met également au clair quelque chose 
que nous avions observé sur des exemples : 


CoroLLaAIRE 15.44 — Soit f : E => F linéaire. Si deux des propriétés 
ci-dessous sont satisfaites, alors la troisième l’est également : 


1. f est injective, 
2. f est surjective, 
3. dim(E) = dim(F). 


Démonstration. Dans le précédent corollaire on a vu que (1) et 

(2) entraînent (3). Supposons que l’on ait (1) et (3). Alors 
dim(Im(f)) = dim(E) - dim(ker(f)) = dim(F) - 0 = dim(F), 

donc Im(f) =F et f est surjective. Si l'on a (2) et (3), alors 


dim(ker(f)) = dim(E)-dim(Im(f)) = dim(F) -dim(F) = 0, 

voir les exercices 
934, 941, 943, 
954, 959 


donc ker(f) = {0} et f est injective. 


Nous verrons de nombreuses applications dans les exer- 
cices. 


VIEUX RÉSULTATS, NOUVELLES DÉMONSTRATIONS 
MMA} 


Le théorème du rang occupe une place centrale en algèbre 
linéaire. À tel point que dans certains livres sur le sujet, on 
trouve une démonstration de ce théorème très tôt dans l’expo- 
sition, avec les autres résultats présentés comme conséquences. 
Ce genre d'approche est plus concis mais plus difficile à suivre 
pour les débutants. Il est probable qu’en deuxième année, on 
vous donne un résumé de l'algèbre linéaire de première année 
qui soit de ce genre. 

Pour se faire une idée, voici de nouvelles démonstrations 
de résultats déjà obtenus, qui font usage du théorème du rang. 
Notez la concision des arguments - en contrepartie de leur côté 
abstrait. Il est naturel que ces démonstrations soient plus diffi- 
ciles à suivre pour l'instant. 


Lemme 15.45 — Soient A et B des matrices carrées telles que AB = 
Id. Alors on a également BA = Id, et B = A 


Nous avions vu ça en tant que lemme 12.23, et la démons- 
tration faisait appel à la notion de matrice bien échelonnée. 


Démonstration. Soit E = M,(K), vu comme un espace vectoriel 
de dimension finie, et soit 


f: MK) — M,R) 
M +  f(M)=BM. 


On voit tout de suite que f est linéaire. Montrons qu’elle est 
injective. Si f(M) = 0, alors BM = 0; en multipliant par A à 
gauche, on obtient ABM = IdM = M = 0, donc ker(f) = {0}. 
Ainsi f est injective, et d’après le corollaire 15.44, elle est éga- 
lement surjective (on a E = F ici). On conclut qu'il existe, en 
particulier, une matrice C telle que f(C) = Id, soit BC = Id. En 
multipliant encore par A à gauche, on a C = A. 


Voici maintenant le résultat selon lequel le rang d’une ma- 
trice est égal au rang de sa transposée (voir le théorème 14.47), 
dans ce nouveau style. On obtient même un peu plus qu'avant. 
Quelques notations : on travaille avec des matrices m x n, et on 
écrit 


1 
pn = 


0 


c'est-à-dire la matrice dont tous les coefficients sont nuls, sauf 
les r premiers sur la diagonale, qui valent 1. Lorsque la taille 
est évidente, on écrit juste I.. 


PRroPOSITION 15.46 - Soit A une matrice m x n. 
1. SiPeM,(K) est inversible, alors rang(AP) = rang(A). 
2. Si Q eM,,(K) est inversible, alors rang(QA) = rang(A). 


3. rang(A) =r = il existe deux matrices P et Q inversibles 
telles que QAP =L. 


4. rang(A) = rang(A). 


Nous avons vu tous ces résultats, à part le (3). La démons- 
tration va être très différente. 


Démonstration. La matrice A donne une application linéaire 
que l’on va noter fa: K” => K”, définie par fa(v) = Av. De 
même on note fp et fo pour les applications linéaires corres- 
pondant à P et Q. 

Montrons le (1). Le rang de A est dim(Im(fa)) = 
dim(f\(K”)), et de même le rang de AP est dim(f\(f(K”))). 
Puisque fp est un isomorphisme, elle est surjective, et 
donc fp(K") = K”. D'où le (1). 

Pour le (2), on note que le rang de QA est dim(fo(fa(K”))). 
L'application g: fa(K") => fo(fa(K")) donnée par g(v) = 
fa(v) est surjective par définition, et injective parce que fo 
est elle-même injective (comme application définie sur K” 
tout entier). Donc g est un isomorphisme et on en conclut 
que dim( fa (K")) = dim(fo(fa(K"))). D'où le (2). 

Pour le (3), si QAP = I, alors d’après les points (1) et (2) 
rang(A) = rang(QAP) = rang(l,), et bien sûr rang(l,) = r. Réci- 
proquement, supposons que le rang de A est r. Comme dans 
la démonstration du théorème du rang, prenons e,,...,ep une 
base de ker(fA), que l’on complète en une base de K” avec des 
vecteurs £1,...,€,; On a vu que l’on obtient une base de Im(f1) 
en prenant fi,..., fr où fi = falei). Enfin, complétons fj,..., fr 
en une base de K” en ajoutant des vecteurs f,:1,..., fn. Si B = 
E1,... Ep C1,..., ek et C = f1,..., fi, alors par définition 


« [fa]? =]. 


Mais alors [fa]? = QAP où Q et P sont des matrices de pas- 
sage bien choisies (et en particulier inversibles). Ceci donne le 
(3). 

Le (4) est maintenant évident. En effet si A est de rang r, 
on a QAP = IP" d'où !P'A!Q = "TP" = IP™, D'après le (3) 
appliqué à ‘A, on en déduit que 'A est de rang r également. 


voir l'exercice 
33541 


Chapitre 16 


Diagonalisation 


On rappelle que la lettre K désigne Q, R ou C. 


MOTIVATION 
oo 


Dans ce chapitre, les concepts d’algèbre linéaire des cha- 
pitres précédents vont être mis en application. Nous allons dé- 
crire la technique générale de la diagonalisation, qui sera uti- 
lisée dans ce livre dans le cadre de problèmes très concrets : 
lors de l'étude de certaines équations différentielles d’une part 
(décrite dans le chapitre 10), et d'autre part pour analyser cer- 
taines suites récurrentes. Voyons ce dernier point tout de suite. 

Imaginons une suite de vecteurs (X,),50, avec X, € Rd, dé- 
finie par récurrence de la manière suivante : on se donne Xọ, 
on fixe une matrice A de dimension d x d, et on pose 


Xy+1 = AX,. (*) 


Pour être très concret, nous allons prendre un exemple célèbre. 
Commençons par la suite de Fibonacci (u,),>0, qui est la suite 
de réels définie par ug = u = 1 et Uy:2 = Uys1 + Un. On peut 
alors poser pour tout n > 0: 


wel Hn er? 


On a alors 


u u 0 1 u 
x _ n+1 = n+1 = n = AX,, 
me | Un+2 Un+1 + Un 1 1 Un+1 í 


où A est la matrice 2x2 ci-dessus. On est donc bien en présence 
d’une suite de la forme (*). Nous allons voir que l’on sait bien 
mieux étudier (X,) que (u„). En fait en passant par (X„), nous 
allons trouver une expression directe pour 4, en fonction de n, 
ce qui n'est a priori pas évident du tout. 

Commençons par quelques calculs : 


X1=AXp, X5=AX;=A?2Xg, X3=AX;=A°X,, 


et par récurrence on obtient immédiatement X„ = A" Xo. Nous 
devons donc calculer les puissances successives de la ma- 
trice A. Par le calcul direct, c'est difficile (essayez quelques va- 
leurs de n pour tenter de deviner la formule). 

Soit alors maintenant 


-1+V5 1-5 
P = 2 72. 
1 1 


D'où sort cette matrice ? Tout le but de ce chapitre, justement, 
est d'expliquer d’où provient P, et comment la trouver par 
vous-même. Pour l'instant, supposons donc que l’on ait envie 
d'essayer cette matrice, et de calculer P-!AP. On trouve 


VS v,1 
p7! = 5 10 2 
-y5 1 
5 10 2 
puis 
A 1+V5 0 
= = 2 
P ar =| ir | 
2 


Voilà qui nous arrange bien. En effet, la matrice P-! AP est dia- 
gonale, c'est-à-dire que seuls les coefficients sur sa diagonale 
sont non-nuls; on peut donc calculer les puissances de cette 
matrice sans effort : 


(155 0 
(P AP)" = i (ss) 


Bien sûr ce que nous cherchons, ce sont les puissances de A. 
Mais à bien y regarder on a : 


(PLAP)? =P-!APP'!AP=P-!A?P, 
et de même 
(PAP)? =P !AP(P!AP)? =P !APP!A?2P=P-!A3P. 
Par récurrence on obtient pour tout n : 
(P! AP)" =P-!A"P. 


Ainsi la matrice que l'on cherche est tout simplement 


(155 k 0 
A" =P(P-!AP)"P-! =p| \ ? „ |p. 
0 (5) 
2 


Il wy a plus qu’à multiplier ces trois matrices. Pour le faire sans 
douleur, introduisons 


1+V5 _1-v5 


À = $ À , 
1 2 2 2 


de sorte que 


p=[ 7% A et p=} 1 à) 
1 1 V5 


En tenant compte de la relation À, Àz = -1, on obtient finale- 
ment 


n-1 n-1 n n 
1 ` - À5 M -25 | 
n n n+1 n+1 
Aï -^4 M à 
Récoltons le fruit de nos efforts, et retournons à la suite de Fi- 
bonacci. Nous avions 


| "n )=X„=A"Xo=A"| i | 


Un+1 


Sur la première ligne de cette égalité de matrices-colonnes, on 
a la relation 


_ 1 


v5 


ce qui est donc une formule donnant le n-ième nombre de Fi- 
bonnaci. Il est remarquable que ce soit un nombre entier, de 
ce point de vue. Noter qu’en utilisant les relations 1 + 14 = À? 
et 1+ 2 = À on peut même simplifier cette expression en 


(At +AT- as), 


Un 


Un = (at 5). 


v5 


Le calcul ci-dessus a été rendu possible par l’arrivée drama- 
tique de la matrice P, ayant la propriété que P-! AP est diago- 
nale. Trouver P, étant donnée la matrice A, est ce qu’on appelle 
diagonaliser A. Dans ce chapitre nous allons voir comment pro- 
céder (lorsque c’est possible). Nous aurons besoin d'utiliser les 
concepts d'espace vectoriel, d'application linéaire, mais aussi 
de déterminant, développés dans les chapitres précédents. En 
un sens, nous voyons une mise en oeuvre de toute cette théorie. 


Pouvez-vous 
utiliser cette 
expression 

pour un afin de 
calculer la limite 


de "iL? 
Un ` 


MATRICES CONJUGUÉES 
[2] 


Nous allons commencer par donner des noms aux phéno- 
mènes observés dans l'exemple précédent. Ce chapitre intro- 
duit beaucoup de vocabulaire! Précisons que, pour cette rai- 
son, nous donnerons vers la fin du chapitre un résumé. Vous 
verrez qu'on en arrive finalement à une méthode vraiment sys- 
tématique (qu’un ordinateur est capable de suivre, d’ailleurs). 
Mais nous avons du chemin à parcourir avant de pouvoir mon- 
trer ça. 


DÉFINITION 16.1 - Deux matrices carrées A et B à coefficients 
dans K sont dites conjuguées, ou semblables, s’il existe une ma- 
trice inversible P à coefficients dans K telle que B = P-!AP (ou 
ce qui revient au même, A = PBP-!). 

On dit qu’une matrice A est diagonalisable lorsqu'il existe 
une matrice diagonale D telle que A et D sont conjuguées. 


ExEMPLE 16.2 - Nous avons vu ci-dessus que la matrice 


0 1 
a-[i:) 
et la matrice 
1+V5 0 
0 2 


sont conjuguées : en effet D = Pl AP avec 


-1+V5 ` -1-V5 
P = 2 2 ; 
(PT) 


En particulier, la matrice A est diagonalisable. 


En présence de deux matrices A et B, il est difficile de sa- 
voir si elles sont conjuguées, et dans ce chapitre nous allons 
apprendre quelques techniques. Voici déjà un premier critère 
simple. 


Lemme 16.3 — Si A et B sont conjuguées, alors det(A) = det(B). 


Démonstration. En effet, si B = P7!AP, alors 


det(B) = det(P) ! det(A) det(P) = det(A). 


ExEMPLE 16.4 -Dans l'exemple précédent, on a 
bien det(A) = det(D) = -1. Par contre les matrices 


2 -3 1 1 
kali x et = AÁ 


ne sont pas conjuguées, puisque det(A) = 2 et det(B) = 0. 


Après le déterminant, voici la « trace » : 


DÉFINITION 16.5 - Soit A = (4;;) une matrice carrée. La trace 
de A, notée Tr(A), est la somme des coefficients sur la diago- 
nale de A. 


ExEMPLE 16.6 -En reprenant les notations de 
l'exemple 16.2, on a Tr(A) = 0 +1 = 1. Pour D, on 


obtient 
1+V5 .1-V5 _, 
2 2 


On obtient le même résultat, et ce n'est pas un hasard. 


Tr(D) = 


Lemme 16.7 — La trace possède les propriétés suivantes : 


1. Si M et N sont carrées, alors Tr(MN) = Tr(NM). 
2. Si A et B sont conjuguées, alors Tr(A) = Tr(B). 


Démonstration. Pour le (1), on fait un calcul direct. Si M = 
(mij)ij et N = (nge)k,e, on trouve en fait 


Tr(MN) = X mixni =Tr(NM). 
i,k 


Pour le (2), supposons que B = P-!AP, et posons M = P™}, 
puis N = AP. Alors 


Tr(B) = Tr(MN) = Tr(NM) = Tr(APP-!) = Tr(A). 


ExeMPLE 16.8 — Nous allons pouvoir donner des exemples 
de matrices qui ne sont pas diagonalisables. Commençons 
par 


Supposons que A soit diagonalisable, donc qu’il existe une 
matrice inversible P telle que 


-ap [à Dh 
P ar =| 0 M 


On doit alors avoir det(A) = 1 = det(D) = à, À 2, et Tr(A) = 
2 = Tr(D) = À + À. Nous connaissons donc la somme et 
le produit de À, et À), et il est alors facile de trouver ces 
nombres : l'astuce habituelle est de regarder le polynôme 


(X=A)(X= 2) = X?-(M +å2)X+A1 À = X2-2X+1 =(X-1)2. 


On en déduit que À, = À, = 1. Mais alors, la matrice D n'est 
autre que la matrice identité ! Par suite 


A=PDP™! =PIdP ! =PP-! =1d, 


ce qui est absurde puisque A # Id. Cette contradiction 
montre que P ne peut pas exister, c'est-à-dire que A n'est 
pas diagonalisable. 

Voyons maintenant la matrice 


0 -1 
FE 
Celle-ci est-elle diagonalisable ? De nouveau, supposons 
qu’il existe P telle que P-!AP = D, avec D ayant les co- 
efficients À et À, sur la diagonale, comme ci-dessus. Cette 


fois-ci, on doit avoir À, à = det(A) = 1 et À + À) = Tr(A) = 
0. Ceci donne 


(X-M)(X-A,)=X2?+1. 


Les nombres À, et Àz, qui sont des éléments de K, doivent 
donc être les racines du polynôme X? + 1. Si K = R, nous 
avons déjà une contradiction, puisque les racines sont i 
et -i, qui ne sont pas dans R : on dit que A n'est pas diago- 
nalisable « sur R ». 

Mais on peut considérer A comme une matrice 
de M;(C), à coefficients complexes, et rechercher P égale- 
ment à coefficients complexes. Dans ce cas on peut prendre 


P=| 1 ; | etalors PAP =( à À. 
-1 i 0 -i 


Donc A est diagonalisable sur C. Là encore, nous allons 
expliquer dans la suite du chapitre comment trouver cette 
matrice P, que nous avons sortie de nulle part. 


voir les exercices 
3401, 3404, 
5627 


INTERPRÉTATION À L'AIDE DES APPLICATIONS LINÉAIRES 
[MM 


La proposition que voici donne des exemples de matrices 
conjuguées, et en un sens elle les donne même tous. 


PRroPosirioN 16.9 — Soit E un espace vectoriel de dimension finie, 
et soit f : E > E une application linéaire. Soient % et B deux 
bases de E. Les matrices de f dans ces bases respectives sont notées 


A=ylf]” et B=g|f]”. 


Alors A et B sont conjuguées, et plus précisément on a même B = 
P-! AP où P est la matrice de passage 


P= /P#. 


Réciproquement, si C est une matrice de la même taille que A, telle 
que A et C sont conjuguées, alors il existe une base € de E telle que 


C =T" : 


Démonstration. C'est la formule du changement de base (pro- 
position 15.30), qui affirme précisément que 


alf]? = el a YPZ. 


Rappelons que si P = P#, alors P! = gPY. 

Pour la réciproque, soit P telle que C = P-! AP. Soient e}, 
e2,... , €n les vecteurs de E dont les coordonnées dans la base % 
sont les colonnes de la matrice P. Puisque P est inversible, ses 
colonnes forment une base de K" (corollaire 14.21), donc la 
famille C = e1,...,e, est une base de E (proposition 14.29). 
D'après la formule du changement de base on a 


UT =P ulf] uP =P AP =C. 


Conclusion : deux matrices sont conjuguées exactement 
lorsqu'elles représentent la même application linéaire dans 
deux bases différentes. De nouveau, les techniques matricielles 
et le concept d'application linéaire vont s'enrichir mutuelle- 
ment. 

Pour diagonaliser, il va être très utile de réfléchir en termes 
d'applications linéaires. En effet : 


ProposiTION 16.10 — Soit A € M,(K), et soit f : IK" => K" lap- 
plication linéaire définie par A, c'est-à-dire f (v) = Av. Alors A est 
diagonalisable => il existe une base e), ez,..., e, de IK" avec la 
propriété que f(e;) = Aje; pour un certain scalaire À; € K. 

Lorsque c'est le cas, soit P la matrice dont les colonnes sont les 
vecteurs e; ; on a alors 


À Ü s A 
Ü Âz 38 A 
Si * 
PIAP = . (=) 
0 0 z 
0 0 À, 


Démonstration. Soit C la base canonique de K”, de sorte que 
A=g [F]. Supposons que la base Z = e}, ..., e, existe avec 
la propriété ci-dessus, alors par définition même de la matrice 
d’une application linéaire, on a 


M 0 0 
0 à 0 
B 
Bf] = (**) 
f 0 0 * 
0 0 An 


Mais d’après la formule du changement de base, on a gl f]? = 
P-! AP avec P = [f]?. Donc (*) est vérifiée, et A est diagona- 
lisable. 

Réciproquement, si (*) est vérifiée, on procède à l'envers : 
on appelle e4, ..., e„ les colonnes de P, qui forment une base Z 
puisque P est inversible; la formule du changement de base 
nous dit que (**) est vérifiée ; et par définition même cela signi- 
fie que f (ei) = Àje;. 


De nouveau, ces choses portent des noms classiques : 


DériniTIoN 16.11 — Soit f : E > E une application linéaire. Un 
vecteur propre de f est un vecteur v + 0 tel que f (v) = Àv pour 
un certain scalaire À € K. On dit que v et À sont associés. 

Lorsque À € K est associé à au moins un vecteur propre, on 
dit que c'est une valeur propre de f. 

Enfin, la valeur propre À étant fixée, l'ensemble des v € E 
tels que f (v) = W est appelé l'espace propre associé à À. Nous le 
noterons E;. 


Notez bien la condition v + 0, qui est essentielle; elle ga- 
rantit que v détermine À, puisque Àv = pv entraîne bien À =p, 
lorsque v + 0. 


ExeMPLE 16.12 -Prenons deux vecteurs e1,e € R? qui 
forment une base, et posons U = Vect(e,), puis V = Vect(e)), 
de sorte que R? = U V. Soit maintenant s la symétrie par 
rapport à U, dans la direction V. 

Par définition, on a s(e;) = ej, donc e, est un vecteur 
propre de s associé à la valeur propre 1. De même s(e>) = 
—e), donc ez est un vecteur propre de s associé à la valeur 
propre -1. Enfin, en écrivant Z =e,,e;,ona 


a= à) 


et cette matrice est diagonale. Par suite, la matrice de s 
dans n'importe quelle base est de la forme 


AT 0 
p È x) 


c'est-à-dire qu'elle est diagonalisable. 


Nous pouvons complètement terminer les calculs présentés 
dans l'introduction de ce chapitre : 


ExEMPLE 16.13 - Retournons à la matrice 


de l'introduction (et de l'exemple 16.2). Pour trouver 
(seuls !) une matrice P telle que 


1.5. fM 0 
P 7): 


on utilise d'abord la même astuce que dans l'exemple 16.8 : 
on doit avoir A + Àz = Tr(A) = 1 et Mà = det(A) = -1. 
Donc 


(X-A )(X-å2) =X? - (4 EIRE NA =X? -X-1. 


Ainsi, À, et à sont les racines du polynôme X? -X -1; 
supposons qu'on les ait numérotées de la façon suivante : 


1+V5 Liv 


À = 2 , A2 = 2 


On comprend déjà mieux d’où provenaient ces V5! 

Maintenant, soit f l'application f (v) = Av, comme dans 
la proposition 16.10. Cherchons les vecteurs propres as- 
sociés à À, : c'est un calcul de système linéaire. En effet, 
l'équation f (v) = à, v s'écrit 


ARR #3) 


Ceci donne le système 


=x + y = 0 
x + (1-l)y = 0” 


et en faisant L, = Lo + xL. on obtient 0 = O sur la 
deuxième ligne. L'ensemble des solutions est donc décrit 
par la seule équation -À\;x + y = 0, on peut prendre y 
comme paramètre, et on constate que l’on a un espace vec- 
toriel de dimension 1, avec comme base par exemple (en 
prenant y = 1) le vecteur 


(FH?) 


En procédant de la même manière pour À„, on montre que 
l’espace propre associé, c'est-à-dire l’ensemble des vecteurs 
tels que f(v) = Av, est un espace de dimension 1 avec pour 
base le vecteur 
=j 
eo = ; 
2=( 7] 


Il se trouve que e,,e est une base de R?, comme on le 
voit tout de suite. Si alors P est la matrice dont les colonnes 
sont e, et ez, la proposition 16.10 nous dit que P-!AP est la 
matrice diagonale annoncée. Voici comment on était venu 
à bout de la suite de Fibonacci. 


voir les exercices 
1605, 2467 


LE POLYNÔME CARACTÉRISTIQUE 
[M] 


Nous savons désormais diagonaliser les matrices 2 x 2, du 
moins lorsque c’est possible, en procédant comme nous l'avons 
fait dans l'exemple 16.13. Ce qui semble nous empêcher de 
faire de même avec des matrices quelconques, c’est que l’on 
ne sait pas a priori quelles sont les valeurs propres poten- 
tielles, alors que pour les 2 x 2 on exploite l'astuce de cal- 
cul (X — 4)(X — À) = X? = Tr(A)X + det(A). Il se trouve qu'il 
existe un polynôme jouant le même rôle pour les matrices de 
n'importe quelle taille. 


Proposirion 16.14-— Soit A € M (K), et soit f l'application f (v) = 
Av. Alors À est valeur propre de f => det(A - Id) = 0. 


L'expression det(A — ÀId) est un polynôme en À, que l'on 
appelle le polynôme caractéristique de A (ou de f). On le note xa, 
ou Xf. 


Démonstration. Cette démonstration est facile en soi, mais il 
est intéressant de noter la quantité de résultats non-triviaux 
des chapitres précédents qui entrent en jeu. 

Pour À € K, notons f - Ald l'application définie par (f - 
Ald)(v) = f(v)-Av. Alors par définition À est une valeur propre 
de f = il existe v + O tel que (f - Ald)(v) = 0 = ker(f - 
Ad) = {0}. 

D'après la proposition 15.39, cette condition équivaut à dire 
que f - Ald n’est pas injective. D’après le théorème du rang (ou 
plus précisément le corollaire 15.44), ceci équivaut encore à 
dire que f - Ald n’est pas bijective. 

D'après la proposition 15.34, ceci revient à affirmer que la 
matrice de f - Ald dans la base canonique n'est pas inversible. 
Or cette matrice est A — Ald, et finalement la proposition 13.5 
affirme que cette condition se ramène à det(A — Id) = 0. 


EXEMPLE 16.15 - Prenons une matrice 2 x 2 : 
a b 
a-(* 8) 
Le polynôme caractéristique est alors 


xa =det(A Ad) = det (( ^ i )-| | : )) 


a— À b 
c d—À 


| =)? (a+ d)À+ (ad — bc), 
ce qui donne dans ce cas particulier 
Xa = À? - Tr(A)\+ det(A). 


On retrouve donc le polynôme de degré 2 qui était apparu 
dans nos calculs avec les matrices 2 x 2. 


EXEMPLE 16.16 — Prenons maintenant 


6 2 1 
—6 -1 -2 |. 


0 0 3 


A= 


Le polynôme caractéristique est donné par : 


6-A 2 1 
Xa=| -6 -1-à -2 = 6-3) 
0 0 3-1 


=(3-A)(A2-51+6)=-(A-3)?(A-2). 


6-À 2 
-6 -1-À 


Les valeurs propres sont donc 2 et 3, et on dit que 3 a une 
« multiplicité » de 2 puisque le polynôme caractéristique 
a (1-3)? en facteur. 

Examinons les vecteurs propres. Pour trouver ceux as- 
sociés à la valeur propre 2, on résout comme d'habitude le 
système Av = 2v. Faites le calcul, vous trouverez un espace 
de dimension 1, avec pour base par exemple 


Ai) 


Pour la valeur propre 3, on résout Av = 3v. L'ensemble des 
solutions est de dimension 2, avec pour base par exemple 


0 1 
eo = 1 et e3=| -1 |. 
=2 =] 


(Vérifiez ceci.) 

Il se trouve que e4, 2,63 est une base de RÌ. Nous avons 
donc une base de vecteurs propres, ce qui signifie que A est 
diagonalisable. Plus précisément, si P est la matrice dont 
les colonnes sont e1, €2,€3, on sait sans calcul supplémen- 


taire que 
2 0 0 
0 3 0 | 
0 0 3 


Donnons quelques proriétés générales du polynômes carac- 
téristique. 


P-lAP = 


ProPosirioN 16.17 - Soient A et B des matrices de M„(K). 
1. Si A et B sont conjuguées, alors xa = XB. 


2. Si À est diagonalisable, alors son polynôme caractéris- 
tique xa est scindé sur K. 


Rappelons qu’un polynôme en À est dit scindé si c'est un 
produit de facteurs de degré 1, c’est-à-dire s’il est de la forme 


c(A- M) 22) (A An). 
Démonstration. Si B= P-!AP alors 
P7I(A -— AId)P = PIAP - APIP = B- Ald, 


donc B-À Id et A—\Id sont conjuguées. Elles ont donc le même 
déterminant, ce qui donne le (1). 

Pour le (2), on utilise le (1) en prenant B diagonale. On a 
alors 


M —À 0 0 
0 =) 0 
XA = XB = j ; =(M 7A) (A À). 
0 0 "4 ; 
0 0 à 


Donc XA est bien scindé dans ce cas. 


voir les exercices 
2762, 2763 


COMPTER LES VECTEURS PROPRES 
ET 


Nous avons essentiellement décrit toutes les étapes néces- 
saires pour diagonaliser une matrice. Mais on peut faire une 
remarque supplémentaire qui va nous simplifier la tâche. 

Après avoir trouvé des vecteurs propres pour les diverses 
valeurs propres, nous devons vérifier si l’on peut trouver une 
base complète, formée de ces vecteurs propres. Il s'ensuit un 
travail de vérification, pour savoir si certaines familles sont 
libres. Vous aurez peut-être remarqué que dans les exemples 
jusqu’à présent, on n'avait jamais de mauvaise surprise : ce n'est 
pas un hasard, comme nous allons le montrer. 

Commençons par 


Lemme 16.18 — Soit f: E > E une application linéaire, et soit e}, 
.., €, une famille de vecteurs propres de f. On suppose que e; est 
associé à ;, et que les nombres ]1,..., À, sont distincts. 
Alors la famille e,,..., e„ est libre. 


Démonstration. Par récurrence sur n, le résultat étant évident 
pour n = 1 (un vecteur propre est non-nul par définition). 

Supposons donc que l’on ait n +1 vecteurs propres, et une 
combinaison linéaire nulle, disons 


ave +: + Anen = 0. (*) 


Appliquons f aux deux membres de (*); en utilisant f(e;) = 
Aje; il vient 


aj À ej + + Ant A€ Ent =O. (**) 


Multiplions (*) par À,:1, et retranchons le résultat à (**); il 
vient 
(A = An) ++ (An — An41)Une„, =0. 


Par récurrence, tous les coefficients de cette combinaison li- 
néaire sont nuls, donc (i; -À,,1)a; = 0 pour 1 < i < n. Comme 
À — À„+1i # O par hypothèse, on en tire a; = 0 pour ces valeurs 
de i. Ensuite il est clair que à,;,1 = 0 également, et la famille est 
donc libre. 


Du coup, l’entreprise de diagonalisation s’en trouve simpli- 
fiée : en deux mots, lorsque l’on réunit des bases des différents 
espaces propres, on obtient une famille qui est automatique- 
ment libre. Si elle comporte suffisamment de vecteurs, et seule- 
ment dans ce cas, on a réussi à diagonaliser. Plus précisément : 


PropPosirioN 16.19 — Soit À € M,(K), et soit f l'application li- 
néaire associée. Soient À\,,À2,..., Àm les racines distinctes du poly- 
nôme caractéristique de A. 

Pour chaque À,;, soit n; la dimension de l’espace propre asso- 
cié ker(f — À; Id), et soit 


Cil, Ci2s-- -s Cin; 


une base de cet espace. 
Alors A est diagonalisable si et seulement si 


n; =n. 


m 
i=l 
Lorsque c'est le cas, la famille comprenant tous les vecteurs e;; est 
une base de K", formée de vecteurs propres de f. 


Démonstration. Montrons que la famille formée de tous les e;; 
est libre. Si on a une combinaison linéaire nulle de la forme 


Ò) tijeij =0, 
i,j 


alors on pose e; = Lj Qj jeij On a f(e;) = Aje; (puisque 
chaque e;; est un vecteur propre associé à À;). De plus on 
ae +e +: +em=0. 

Cette relation donnerait une contradiction au lemme pré- 
cédent, à moins que tous les vecteurs e; soient nuls (et ne 
sont donc pas des vecteurs propres). On a donc e; = 0 et donc 
chaque a; j = 0 puisque la famille e;1,e;2,...,e;,, est libre. 

Comme annoncé, la famille formée de tous les e;; est libre. 
Elle comporte Ÿ ; n; élements, donc si } ;n; = n = dim K", c'est 
une base. Dans ce cas, on est en présence d’une base formée de 
vecteurs propres, donc A est diagonalisable. 

Pour finir, supposons que } ;n; < n. Un vecteur propre v 
de f doit appartenir à un ker(f - À; Id) pour un certain i, donc 
en particulier v € Vect(e;;). Mais l'espace Vect(e;;) est de dimen- 
sion } ;n; < n, et il ne peut pas contenir une base de K". Donc 
il n'existe pas de base de K” formée de vecteurs propres de f, 
et À n'est pas diagonalisable. 


En particulier, on a le résultat suivant, étonnamment simple : 


CoroLLAIRE 16.20 - Soit A € M,(K). Si le polynôme caractéris- 
tique de À possède n racines distinctes dans K, alors A est diago- 
nalisable. 


Démonstration. Soient À1,...,À, les valeurs propres (dis- 
tinctes). Chaque espace ker(f - 1; Id) est + {0}, par définition, 
donc il est de dimension > 1. Ainsi, la somme D; n; de la pro- 
position précédente est > n; mais bien sûr cette somme est 
aussi < n puisque l’on a vu que c’est le nombre de vecteurs 
dans une certaine famille libre. 

Finalement Ÿ';n; = n, donc A est diagonalisable (et de plus 


chaque n; = 1). 


Lorsque l’on souhaite montrer qu’une matrice est diagona- 
lisable, mais que l’on n’a pas besoin de trouver expressément 
les vecteurs propres, ce corollaire est évidemment idéal. Nous 
verrons une application dans le chapitre sur les équations dif- 
férentielles. 

Avant de donner des exemples d'utilisation de ces derniers 
résultats, nous allons résumer la méthode développée dans ce 
chapitre. 


RÉSUMÉ 
EE oo n 1 


Soit A € M,(K), soit f : K” => K” l'application linéaire dé- 
finie par f (v) = Av. Pour tenter de diagonaliser A, on suit les 
étapes suivantes. 


1. On calcule le polynôme caractéristique x4 = det(A-—Ald), 

et on trouve ses racines distinctes A,...,À,, dans K. 

© Si xa n'est pas scindé, alors A n’est pas diagonalisable, 
et on s'arrête. 

o Si xa est scindé, on passe à l'étape suivante. Si n = m, 
c'est-à-dire si on a n valeurs propres distinctes, alors 
on sait déjà que A est diagonalisable. 

2. Pour chaque À,;, on calcule une base de ker(f - À; Id). On 

en déduit sa dimension n;. 

o Si} ;n;<n,la matrice A n'est pas diagonalisable, et on 
s'arrête. 

o Si} ;n;=n, la matrice est diagonalisable, et on passe à 
l'étape suivante. 


3. Soit eii, €j2,..., ein; une base de ker(f - À;Id). Alors la 
réunion de tous ces vecteurs est une base de K”. Soit P 
la matrice dont les colonnes sont, dans l’ordre : 


Etre Clnire es Emlr---r mny: 


Alors sans calcul supplémentaire on sait que 


A => 0 0 +++ 0 
: `. 0 0 0 0 
0 0 À 0 0 0 
P 'AP = 0 0 0 À 0 0 
:` 0 0 0 `. 0 
0 0 0 0 0% 
0 0 0 


À droite on a une matrice diagonale, où À1 apparaît nı 
fois, puis À) apparaît n, fois, etc. 


EXEMPLE 16.21 — Prenons 


Le calcul du polynôme caractéristique donne 
Xa =>? +5A2+2A -24. 


Selon la façon de calculer le déterminant, ce polynôme 
peut vous apparaitre factorisé, ce qui est évidemment une 
bonne chose pour calculer les racines. En règle générale, 
les opérations sur les lignes ou les colonnes, plutôt que les 
développements, ont tendance à produire des polynômes 
factorisés. 

Mais admettons que nous ayons obtenu le polynôme 
sous la forme ci-dessus. Il faut trouver une racine « évi- 
dente ». Dans cette situation, il est souvent utile de revenir 
à la matrice : n'est-il pas clair que si on ajoute 2 sur la dia- 
gonale de A, alors la première colonne devient égale à la 
troisième? Donc det(A + 2Id) = 0, ce qui signifie que -2 
est valeur propre, et Xa(—2) = 0. On termine ensuite facile- 
ment la factorisation : 


Xa =-(A+2)(A2-7A+12)=-(A+2)(A-4)(A-3). 


Les valeurs propres sont -2, 4 et 3. On a trois valeurs 
propres distinctes, donc on sait que la matrice est diagona- 
lisable. (Ceci conclut l'étape 1). 

Avant de poursuivre les calculs, dressons la liste de 
ce que nous pouvons déjà prévoir. Nous allons trouver 
des vecteurs e,, e et e3, vecteurs propres associés à -2, 
4 et 3 respectivement ; ces vecteurs vont former une base 
de R3, automatiquement. Soit P la matrice dont les co- 
lonnes sont e,, ez, ez. Alors 


-2 0 0 
P'AP=| 0 4 0 
0 0 3 


Ce sont les conclusions de l'étape 3. Si les valeurs propres 
n'avaient pas été distinctes, on n'aurait pas pu prévoir le 
résultat de l'étape 2. 

Cette étape 2 reste à faire, de toute façon. Pour la va- 
leur propre -2 par exemple, on cherche ker(f +21Id) ce qui 
revient à résoudre 


3x = y + 3z = 0 
2x + 5y + 2z = 0 
3x + Y + 3z = 0 


En quelques étapes on constate que ce système équivaut 
aux équations y = 0 et x + z = 0. En prenant z = 1 par 
exemple, on obtient 


e, = 0 
1 


De la même manière, on obtient 


-1 1 
eo = 5 |, e3 =| 12 
1 5 
voir les exercices 
2468, 2580, 
2764, 2765, 


- Fin de la première lecture - 2766 


TRIGONALISATION 
[p-a] 


Nous l'avons vu, la diagonalisation ne fonctionne pas tou- 
jours. À défaut de pouvoir diagonaliser, on tente parfois de tri- 
gonaliser. 


DÉFINITION 16.22 - Une matrice carrée est dite triangulaire (su- 
périeure) lorsque les coefficients sous la diagonale sonts nuls. 

On dit qu'une matrice carrée A est trigonalisable lorsqu'elle 
est conjuguée à une matrice triangulaire, c'est-à-dire lorsqu'il 
existe P telle que P-! AP est triangulaire. 


EXEMPLE 16.23 - La matrice 
3 1 
(5 3) 

est triangulaire (donc trigonalisable !). On peut voir facile- 
ment qu’elle n’est pas diagonalisable : en effet xa = (À-3)?, 
donc la seule valeur propre est 3, et l’espace propre corres- 
pondant n’est que de dimension 1. 

Il est quand même possible de faire des calculs avec A, 


par exemple de calculer A”, même si c’est plus difficile que 
pour une matrice diagonale. Posons 


3 0 0 1 
palo 3) i N=( o ò l 
de sorte que A =D +N. On a N? = 0, ce qui va grandement 


nous aider. Notons également que DM = MD = 3M pour 
toute matrice M. On peut donc calculer 


A? =(D+N)2? = (D+N)(D+N) = D?+ND+DN+N? = D?+6N. 
De même 
A3 = (D? + 6N)(D +N) = D? + 6ND + D?N + 6N? 
=D3+18N+9N =D? +27N. 


Visiblement A” est de la forme D” +a,N. On a a) = 6 = 2x3 
et az = 27 = 3 x 3?. Supposons que a, = n3"-1, alors 


AT = (D” + 13" IN)(D +N) = DL + (n+1)3”N. 


Par récurrence, ceci montre que 4, = n3"-1 pour tout n. 
Finalement la matrice A” vaut 


3" 0 ı/0 1 3" n3™! 
n n-1 _ n-1 _ 
D” +n3 N=| 0 3" js H HH 0 gn | 


Lorsqu'une matrice est triangulaire, avec À, À2,..., À, sur 
la diagonale, son polynôme caractéristique est (A1 — À)(À2 — 
A) (àn — À). En particulier il est scindé; toute matrice dont 
le polynôme caractéristique n’est pas scindé ne peut donc pas 
être trigonalisable. 

Sur C, tous les polynômes sont scindés d’après le théorème 
fondamental de l’algèbre, donc on ne risque pas de trouver de 
matrices non-trigonalisables en procédant comme ça. Et en fait, 
il n'y en a pas! En effet : 


ProposirioN 16.24 - Soit A E M,(C). Alors A est trigonalisable. 


Démonstration. On va procéder par récurrence sur n (pour n = 
1 il n'y a rien à prouver). 

Soit x4 le polynôme caractéristique de A. Comme on est 
sur C, ce polynôme possède au moins une racine, disons A. 
Si f est l'application f(v) = Av, alors par définition, on a donc 
un vecteur propre e, tel que que f(e1) = Xe. 

D'après le théorème de la base incomplète, on peut trouver 
une base H =e], ez, ..., e, de C” dont le premier vecteur est e4. 
La matrice de f dans la base Ø est de la forme 


M *# OÆ «se * 
0 
au =| . À j 


0 


où À est une matrice (n — 1) x (n — 1) (et + est un coefficient 
quelconque). 

Par récurrence, il existe une matrice inversible Q telle que 
la matrice T’ =Q-!A'Q est triangulaire. Posons alors 


Q 


L'inverse de P est de la même forme, avec Q remplacée par Q-!. 
Un petit calcul montre alors que 


M % % eo  * 


P @[f]7P= E 


0 


En particulier cette matrice est triangulaire, puisque T’ l’est; 
notons-la T, de sorte que g[f] 7 = PTP-!. 

Enfin, notons € la base canonique, ce qui permet d'écrire 
A =< [f]. Notons également R = gP6. La formule du chan- 
gement de base nous dit que 


A=R'!œ[f]#R=R'PTP'R=S-`TS, 


avec S = P-!R. Ainsi, la matrice A est bien conjuguée à la ma- 
trice triangulaire T. 


Le théorème montre donc qu'il existe P telle que 


À * =a. * 
P ' AP = Lo 
Àn 


Le polynôme caractéristique de A est donc 
(M = A) => (An À), 


et les nombres À; sont les valeurs propres de A. On observe 
alors que Àj + A2 + + + À, = Tr(A), et A1À2:--À, = det(A), for- 
mules que nous connaissions pour n = 2. En d’autres termes : 


COROLLAIRE 16.25 - La somme des valeurs propres d’une matrice 
complexe, comptées avec leurs multiplicités, est égale à sa trace; le 
produit de ces valeurs propres est égal à son déterminant. 


On a une notion évidente de matrice triangulaire inférieure, 
lorsque les coefficients au-dessus de la diagonale sont nuls. On 
déduit du théorème précédent que : 


COROLLAIRE 16.26 - Toute matrice complexe est conjuguée à une 
matrice triangulaire inférieure. 


Démonstration. On applique le théorème à la matrice transpo- 
sée ÍA : il existe donc P telle que T = P-!(/A)P est triangu- 
laire supérieure. En transposant, on obtient 'P A!'P-! =T. Po- 
sant Q =/P-l, on a bien montré que Q'AQ =T était triangu- 
laire inférieure. 


APPROXIMATIONS 


À l’aide de la proposition 16.24, on peut montrer que « la 
plupart » des matrices sont diagonalisables. Plus précisément, 
nous allons montrer : 


ProposirioN 16.27 - Soit A une matrice à coefficients complexes. 
Alors il existe une suite (A,),>0 de matrices diagonalisables, telle 
que 


A, —— A. 
nœ 


Rappelons un peu ce que la convergence signifie. Si A € 
My (C), alors chaque A, € MN(C) ; dire que A, converge vers A 
signifie que les N? coefficients de A, convergent les N? coeffi- 
cients de A. Mais on peut identifier une matrice de MN(C) avec 
un vecteur de CN? (ou encore de R4N?, en voyant C comme R?), 
et penser à la convergence en termes de norme comme dans la 
proposition 3.29, si l’on préfère. 

Cette proposition est à rapprocher de ce que font les ordi- 
nateurs lorsqu'ils effectuent des calculs numériques approchés. 
Étant donnée une matrice à coefficients réels ou complexes, et 
quelle que soit la précision requise, un ordinateur (auquel on 
ne demande pas explicitement de faire des calculs exacts) va 
toujours annoncer qu'elle est diagonalisable (sur C). Concrè- 
tement, les valeurs propres, dont seule une valeur approchée 
sera calculée, seront toujours considérées comme distinctes, et 
dans ce cas on a le corollaire 16.20. 

C'est cette même idée qui va guider la démonstration. 


Démonstration. D'après la proposition 16.24, on peut trouver P 
telle que P-!AP est triangulaire; utilisons les notations sui- 


vantes : 
M * * * 


eT du: 
T=P'AP= j . (+) 


ÀN 


Soit maintenant T„ obtenue en prenant les coefficients de T 
mais avec les changements suivants sur la diagonale : 


14 +4 * * * 
2 
Mti 


N 
ÀN + F 


(Les coefficients + sont les mêmes que dans (+); seule la dia- 
gonale est changée.) Donc sur la ligne i on rencontre le coeffi- 
cient p; = Hin = h; +. 

Nous allons voir que les coefficients p; sont tous distincts, 
pour n suffisamment grand. En effet, si i et j sont deux indices 
distincts, alors nous avons deux cas à considérer : d'abord, 
si A; = ;j, alors p; — pj = =L +0 puisque i + j ; si par contre À; + 
àj, alors puisque p; converge vers À;, et p; converge vers À;, il 
est clair que y; + pj dès que n est suffisamment grand. 

D'après le corollaire 16.20, la matrice T, est diagonalisable, 
pour tous les n suffisamment grands. Or il est clair que 


T, —>T etque PTP = PTP! =A. 
n= co n— co 


Enfin, nous notons que PT„P-! est diagonalisable pour n suffi- 
samment grand, comme T„. 


Quatrième partie 


Appendices 


Annexe À 


Les mathématiques au 
lycée 


Dans cet appendice nous allons recenser les résultats que 
vous avez probablement vus au lycée et qui vont être utiles 
cette année. Le programme officiel de terminale (et d'avant) 
change souvent, et vous pouvez donc vous attendre à décou- 
vrir une chose ou deux, mais rien de très surprenant. 

Certains élèves vont souhaiter commencer par une lecture 
détaillée de cet appendice avant même de lire le premier cha- 
pitre, alors que d’autres préfèreront remettre cette annexe à 
plus tard. L'auteur pense que le plus simple est de consulter 
l’appendice à mesure que le texte principal fait référence à des 
choses du lycée. (Pour prendre un exemple simple : mieux vaut 
lire la définition d’une « bijection » dans le chapitre 1 avant de 
se replonger dans la définition de arccos.) Mais tout est pos- 
sible. 

Vous serez peut-être déstabilisés par le fait que dans cet ap- 
pendice, nous parlons de dérivées, de racines n-ièmes, de l’ex- 
ponentielle, etc, alors qu’en lisant les chapitres du livre en com- 
mençant par le début, on a l’impression de reprendre tout à 
zéro. Pourquoi ça? Pourquoi ne pas continuer le cours là où il 
s'est arrêté en terminale ? 

La raison en est, ne le prenez pas mal, que les connais- 
sances que vous avez acquises en mathématiques jusqu'ici ont 
quelques imperfections. C’est une chose naturelle et souhai- 
table : une première exposition aux concepts des mathéma- 
tiques se doit de repousser quelques difficultés à plus tard. 
Pensez aux dérivées : savez-vous pourquoi une fonction dont 
la dérivée est positive est nécessairement croissante ? Pouvez- 
vous écrire une démonstration complète ? Et pourtant, les déri- 
vées sont déjà de l’histoire un peu ancienne pour vous. (Il y a 
bien pire : savez-vous définir ce qu'est un angle? Savez-vous 
montrer qu’il y a un nombre dont le carré vaut 2?) 

Cette année, tout en abordant un grand nombre de nou- 
veaux thèmes, nous allons combler toutes ces petites lacunes. 
Le plus simple pour organiser l'exposition est finalement de 
repartir du début, en allant vite sur les concepts qui vous sont 
déjà familiers. 

Pour les raisons que nous venons de donner, cet appendice 
est rédigé dans un style assez différent de celui des chapitres, 
qui contiennent le cours à proprement parler. Pour le moment, 
on suppose que les fonctions, les dérivées, les angles, V2... 
sont des choses que vous connaissez, et nous dressons la liste 
des choses que vous savez en dire. 


L'ALPHABET GREC 
aaa] 


Symbole | Nom | Symbole Nom 
a alpha E xi (ksi) 
B bêta o omicron 
Y gamma T pi 
Ò delta p rhô 
€ epsilon o sigma 
C zêta T tau 
(s) thêta v upsilon 
L iota P phi 
K kappa X khi 
À lambda p psi 
u mu w omega 
v nu 


LES « FONCTIONS USUELLES » 
[M 


Le terme de « fonctions usuelles » désigne un arsenal de 
fonctions que l’homme honnête se doit de connaître, tant elles 
reviennent souvent dans les problèmes que l’on rencontre. 


Exponentielle & Logarithme. Un résultat fondamental af- 
firme qu'il existe une fonction exp: R > R, appelée l’exponen- 
tielle, qui vérifie exp(0) = 1 et qui est égale à sa propre déri- 
vée : exp’ = exp. (Et en fait il n’y en a qu’une : voir l’encadré 
« Quelques démonstrations » pour plus d'informations.) Lal- 
lure de l’exponentielle est donnée sur le dessin suivant. 


(2; 7,38) 


(-5; 0,006) 


Elle vérifie la relation fondamentale 


exp(x + y) = exp(x)exp(y). 


À cause, ou plutôt grâce à cette relation très agréable, on 
note souvent e* au lieu de exp(x). (Le nombre e = el vaut à 
peu près 2,718.) On a e**? = e*e?, et e* = (e*)-!, comme on s'y 
attend. Pour tout entier n on a de même (e*)" = e"*. 

Le nombre e* n’est jamais nul, puisque son inverse existe et 
vaut même e *. En d’autres termes la fonction exponentielle ne 
s’annule jamais, et par le théorème des valeurs intermédiaires 
on sait qu’elle ne change jamais de signe. Puisque e? = 1 > 0, 
on doit avoir e* > 0 pour tout x; et comme exp” = exp, la fonc- 
tion exp est strictement croissante (sa dérivée étant strictement 
positive), conformément au dessin. 

L’exponentielle réalise une bijection exp: R => R”? = 
]0;+co[. La bijection réciproque s'appelle le logarithme népé- 
rien et est notée In: R>? => R. On a la relation fondamen- 
tale exp(In(x)) = x pour tout x > 0, et In(exp(x)) = x pour tout x. 
De plus 

In(ab) = In(a)+In(b), 


puisque les deux membres de cette équation deviennent tous 
les deux ab en prenant l’exponentielle. Notez aussi In(1/a) = 
—In(a), ainsi que les valeurs particulières In(1) = 0, ln(e) = 1. 
L'allure du logarithme est donnée sur le dessin ci-dessous (avec 
l’exponentielle en pointillés). 


(0,1; -2,3) 


Conformément à ce que l’on voit sur ces images, on a 


lim e*=0, lim e* = +00, 
X—>—00 X— +00 
ainsi que 
lim ln(x) = -co, lim In(x) = +00. 
x—0 X—+00 


D'ailleurs « l’exponentielle l'emporte sur les polynômes », ce 
qui signifie que les limites ci-dessus « l’emportent » dans les 
formules que voici : 


lim x"e*=0, lim — = +00, 
X——00 X—+00 x" 


où n est un entier > 0. 


Cosinus & Sinus. Soit C du cecle de centre (0,0) et de 
rayon 1, dans le plan. Considérons l'intersection de ce cercle et 
de la demi-droite qui fait un angle 6 avec l'axe horizontal ; nous 
obtenons un point dont les coordonnées sont (cos(8),sin(8)), 
par définition (c’est-à-dire que les nombres cos(@) et sin(@) sont 
définis par cette situation géométrique). On prononce « cosinus 
O » et «sinus 0 ». 

(0,1) 


1) = (cos( E), sin(f )) 


(1,0) 


Listons quelques unes des propriétés essentielles de ces 
fonctions. Avant tout, puisqu'un angle de 27 représente un 
tour complet, on note que la demi-droite faisant un angle O 
avec l'horizontale est confondue avec la demi-droite faisant 
un angle 8 + 2x avec l'horizontale : donc cos(8 + 27) = cos(0) 
et sin(0 + 27) = sin(0). On dit que les fonctions cosinus et sinus 
sont 2Tt-périodiques. 

Ensuite, remarquons qu’un point (x, 
est à distance 1 de (0,0), donc si x? +y? = 
toujours 


y) appartient à C s’il 
1. En particulier on a 


cos(0)? +sin(0)? =1. 
Les dérivées des fonctions cosinus et sinus sont données par 
cos’ =-sin, sin’ = cos. 
Par ailleurs on a les relations à savoir 
cos(x + y) = cos(x) cos(y) -sin(x) sin(v), 


sin(x +y) = cos(x)sin(y)+sin(x)cos(y). 


On peut retrouver toutes les autres formules « de trigono- 
métrie » à partir de ces deux-là, par exemple sin(x + 5) = 
cos(x) sin(5) + sin(x) cos( 7) = cos(x). On peut essayer de se rap- 
peler qu'en faisant x = y on a aussi 


cos(2x) = 2 cos(x)? - sin(x)? =2cos(x)?-1, 


et 
sin(2x) = 2 sin(x) cos(x). 


Et enfin, signalons les relations 


cos(-x) = cos(x), , sin(—x) =-sin(x), 


qui sont évidentes géométriquement (mais vous pouvez essayer 
de les démontrer, à titre d'exercice, de manière algébrique). 

Le dessin suivant donne l'allure de nos deux fonctions (co- 
sinus en trait plein, sinus en pointillés). 


Pour regarder de plus près le cosinus par exemple, on peut 
se contenter de faire une étude sur [-n, x], par périodicité; 
et comme cos est paire, on peut même se restreindre à [0, T<]. 
Sur cet intervalle, le cosinus réalise une bijection cos: [0,Tt] — 
[-1,1], qui est décroissante. Sa bijection réciproque, appelée 
« arccosinus » et notée arccos: [-1,1] — [0, r], est représentée 
sur le dessin suivant. 


CLT) 
x N 

SON | 
A i 
2 


On a donc les relations cos(arccos(x)) = x pour tout x € 
[-1,1], et arccos(cos(6)) = O pour © € [0, n] (attention, cette re- 
lation n’est pas valide pour 0 € R quelconque !). 

Avec le sinus, on montre que c’est sur |- 3, 7] que l'on a une 
bijecion sin: [-3,5] > [-1,1]. La bijection réciproque s’ap- 
pelle « arcsinus », elle est notée arcsin: [-1,1] > [-3,5]. La 
situation est résumée sur le dessin suivant. 


On a sin(arcsin(x)) = x pour tout x € [-1,1] 
et arcsin(sin(0)) = O pour tout © € [-5,5] (mais pas pour 
tout 0 € R). 

Les dérivées sont données par 


1 1 
arcsin’ (x) = 


VI =x2 `" 1x2 


Notez que l’on a alors (arccos(x)+ arcsin(x))' = 0, donc la quan- 
tité (arccos(x) + arcsin(x)) est constante; en prenant x = 0 on 
découvre que 


arccos' (x) = — 


TT ; 
arccos(x) = z arcsin(x), 


pour tout x € [-1,1]. 


Tangente. On pose 


sin(0) 


pie cos(0) 


lorsque ça a un sens, c'est-à-dire pour 90 E Rx (F +km, ke 
Z}. Puisque sin(0 + tt) = -sin(0) et cos(0 + x) = -cos(0), on 
a tan(0 + tt) = tan(0) : en d'autres termes, la fonction tangente 
est n-périodique. Sa dérivée est donnée par 


tan’(6) = =1+tan(0)2, 


cos(0)2 


ce qui montre que la fonction est croissante sur chaque inter- 
valle oà elle est définie. L'allure de la tangente est donnée sur 
le dessin suivant. 


La restriction à ]- 3, ž[ de la fonction tangente est une bi- 
jection sur R tout entier. La bijection réciproque arctan: R > 
]- 3.5[ s'appelle « arctangente », et son graphe est donné 
ci-dessous. On a donc tan(arctan(x)) = x pour tout x € R, 
et arctan(tan(0)) = 0 pour 0 e]- 7, 5[ (mais pas pour tout © € 
R). 


= arctan(x) L 
_ 
_ 


y 


= 


RÈGLES DE CALCUL DES DÉRIVÉES 
[M] 


Nous avons rappelé les dérivées des fonctions usuelles. 
Rappelons également que la dérivée de x H> x" est x œ nx", 
pour tout entier n > 0. Partant de là, on se sert constamment 
des règles suivantes : 

o (f +8 =f +g. 

o (fg) =f'8+ f8. 

5 (£) = fefe, 


ExEMPLE A.1 — Calculons par exemple 


| cos(x) ) __—sin(x)(3 + 5x?) 10xcos(x) 
3+5x2) (3 + 5x2)? | 


Il y a enfin une règle pour calculer la dérivée de x H> 
f(g(x)). Curieusement, elle semble disparaître peu à peu des 
programmes des lycées. La voici : 


o f(g(x) = f'(g(x)g"(x). 


ExEMPLE A.2 -La dérivée de sin(4x) est donc 4cos(4x), 
comme on le voit avec cette formule pour g(x) = 4x 
et f(x) = sin(x). De même la dérivée de exp(2x + 1 
est 2exp(2x + 1). En général la dérivée de exp(g(x) 
est g'(x)exp(g(x)). Par contre 


et donc la dérivée de In(12x) est 1 (peu surprenant dans la 
mesure où In(12x) = In(12) + In(x)). 


ExEMPLE A.3 -La dérivée de exp(aln(x)) est 
donc %exp(aln(x)). Ce résultat mérite quelques com- 
mentaires. 

La quantité exp(aln(x)) est souvent notée x“ (pour x > 
0 et a quelconque), ce qui est cohérent avec la notation 
pour les entiers : c’est-à-dire que si œ est un entier > 0, 
alors la définition de x“ que l’on vient de donner revient 
à xxxx-..xx, le tout œ fois. De même si œ est un entier < 0, 
alors x% = (1) comme prévu. 

On a la relation x*xP = x%**P comme on le vérifie facile- 
ment, et aussi (x*)P = x. Par exemple (x%)" = x, et x!” est 
bien une « racine n-ième » de x. 

La formule pour la dérivée stipule alors que (x 
ax"*-!. Autrement dit : la formule (x") = nx"! marche 
aussi pour les puissances qui ne sont pas des nombres en- 


tiers. Déjà pour a = —1 on retrouve que la dérivée de 1 = 


x 
x ! est =x? = 4 (on peut aussi retrouver ça par la for- 


mule générale pour la dérivée de f/g, évidemment). Dans 


ay = 


^ D 1 l-n 
le même genre, la dérivée de x” est lx Te 


ExEMPLE A.4 -Il faut savoir dériver la composée 
de trois fonctions, c’est-à-dire une expression de la 
forme f(g(h(x))). D'après la formule précédente, la dérivée 
est 


f '(glhx)))g(h(x))' = f (g(h(x)))g"(Hx))H' (x). 


Par exemple 


exp(cos(x? + 1))' =-2xexp(cos(x? + 1))sin(x? +1). 


LES COMPLEXES ET LA GÉOMÉTRIE DU PLAN 
EE 


Au lycée on vous a parlé de l'existence des nombres com- 
plexes, qui sont de la forme x+iy, où x,y E R et i est un nombre 
complexe vérifiant i? = -1. Leur ensemble est noté C. Dans 
le cours nous reviendrons sur leurs propriétés algébriques (en 
particulier nous montrerons que ces nombres existent bien, 
ce qui n’est pas complètement évident pour i!). Pour lins- 
tant nous souhaitons faire quelques rappels sur l’utilisation des 
complexes en géométrie. 

On va toujours identifier C et R?, le nombre x + iy étant 
identifié à (x, y). Un nombre complexe A = x+iy peut donc être 
vu comme un point dans le plan, d’abscisse x et d’ordonnée y. 
On dira parfois que x + iy est l'affixe du point (x, y). 

Les opérations algébriques sur les complexes peuvent être 
interprétées géométriquement. C’est peut-être la différence B- 
A qui se voit le mieux : l’abscisse et l’ordonnée de B-A sont les 


—> 
coordonnées du vecteur AB, qui donne la translation menant 
de A à B. D'ailleurs en écrivant O pour le point d’affixe nulle 
(l'origine), on peut penser au nombre complexe A comme re- 

>; 
présentant le vecteur OA. L'addition se comprend alors sim- 
plement, puisque A + B est obtenu en opérant une translation 
— — 
de vecteur OA + OB, appliquée à l’origine. En d’autres termes, 
A + B est comme dans le dessin suivant. 


A+B 


o 


Pour comprendre la multiplication, il va nous falloir la no- 
tation polaire. Tout d'abord la distance de A à l'origine O sera 
notée |A], que l'on appelle le module de A. Si A = x + iy, on a 
ainsi |A| = yx? +2. Il en résulte |A - B| = |A| -[B]. 

On va maintenant écrire e/° pour 


e!'9 = cos(0) + isin(0). 


Cette écriture est l’une des plus mystérieuses de la terminale. 
Plus loin dans ce livre nous donnerons des explications com- 
plètes (voir le chapitre « L'exponentielle »). Pour l'instant on 
va se contenter de remarquer que les formules pour cos(a + b) 
et sin(a + b) montrent que 


eita+b) eia ib 


C'est une excellente nouvelle : il est bien plus facile de mémo- 
riser eitb) = git pib que de mémoriser séparément les deux for- 
mules pour cosinus et sinus, alors qu'on peut les retrouver en 
examinant les parties réelles et imaginaires. Notons aussi que 
le module de e/° est 1, puisque cos(0)? + sin(0)? =1. 

Supposons maintenant que le point A = x + iy est sur le 
cercle de centre O et de rayon 1 ; en d'autres termes, x?+? = 1. 
Comme nous l'avons dit dans notre étude des fonctions cosinus 
et sinus ci-dessus, on peut écrire x = cos(0) et y = sin(@) où O 
est l'angle entre l'axe horizontal et OA.Ona donc, avec notre 
nouvelle notation, A = e!9. On dit parfois que © est l'argument 
de A; puisque O n'est pas unique (il est défini à un multiple 
de 27 près), on devrait dire un argument de A. 

Si maintenant A est un complexe quelconque (mais non 
nul), le nombre A/|A| est de module 1, donc on peut écrire 
A/|A| = £? comme ci-dessus, et O est encore l'angle entre l'axe 


_ > 
horizontal et OA. Finalement 
A =[|AJe9. 


Nous pouvons enfin examiner le produit de A = |A] e? par B = 
B|e'°° : nous obtenons AB = [AJB] e#(9+9). Plus visuellement : 
les modules se multiplient, les arguments s'ajoutent. 

Pour énoncer ceci de manière encore plus géométrique, 
fixons A = et € C, un complexe de module 1, et considé- 
rons l'application du plan vers lui-même donnée par Z H> AZ. 
D'après le calcul précédent, il s’agit de la rotation de centre O et 
d'angle ©. De même, si p > 0 est réel, l'application Z + pZ est 
l’homothétie de centre O et de rapport p. On peut donc affirmer en 
général que, pour A = pef? un complexe non-nul quelconque, 
l'application Z > AZ est la composée d’une rotation et d’une 
homothétie, comme indiqué. 

Un raisonnement similaire montre que la rotation de centre 
quelconque M et d'angle O s'exprime avec les complexes par la 
formule Z => M+e'0(Z - M). (On pourrait presque écrire Z => 
M + ei8 MZ, encore que multiplier un vecteur par un complexe 
peut prêter à confusion, et n'est pas recommandé.) L'homothé- 
tie de centre M et de rapport p est donnée par Z H> M+p(Z-M). 
La composée des deux transformations que nous venons d'in- 
diquer est Z > M + pet? (Z -M). 

Soient maintenant A, B et C trois points du plan. Dire que 
l'angle entre AB et AC est O revient précisément à dire que 
l’image de B par la rotation de centre A et d'angle 6, suivie de 
l’homothétie de centre A et de rapport p = |C - Af/|B - A|, est 
tout simplement C. En clair 


C= A+pe/°(B—A). 


Plus algébriquement : on écrit le complexe SA sous la forme 
8 q P B-A 


«polaire » pe’, et alors O est l'angle (défini à un multiple de 27 
près, comme d'habitude) entre AB et AC. En coordonnées, 
écrivons B-A = x+iy (ou AB = (x,y), ce qui revient au même), 
et C-A = x’ + iy’. Alors 
i C-A x+iy xx +yy xy -xy 

“B-A x+ iy = x? + y? ri x? +y? 


pe 


(en multipliant numérateur et dénominateur par x -— iy). En 
comparant les parties réelles, sachant que p = |C - Af/|B = AJ, 
on obtient 
xx’ + vyy' = |C- A||B - A| cos(0). 

La quantité xx’ + yy’ est appelée le produit scalaire des deux 
vecteurs AB et AC. Il existe plusieurs notations, comme AB : 
=> = > La, . 

AC, ou encore | AB, AC |]. La dernière formule affirme que le 


produit scalaire est le produit des normes des deux vecteurs, 
que multiplie le cosinus de l'angle entre eux. 

Deux vecteurs sont perpendiculaires, par définition, 
lorsque l'angle entre eux est +5 (à un multiple de 2x près). 


: LR : ==> > 
Puisque e’? = i, les formules ci-dessus montre que AB et AC 
sont perpendiculaires exactement lorsque 


C-A . 

B-A ` > 
c'est-à-dire lorsque le rapport = est imaginaire pur. Et sur- 
tout, en termes du produit scalaire, les deux vecteurs sont per- 


. . === =>; 2ç ... ` À 
pendiculaires lorsque AB : AC = 0. Cette définition très algé- 
brique de la notion de perpendicularité est utilisée sans cesse. 


LES RACINES ñ-IÈMES 
om 


Jouons un peu avec l'écriture « polaire ». On a l'identité 
(e9)1 = e1i0, On en déduit que 


2ikn \" ; 
(#74) = e” =], 


2ikn A . 

donc que les nombres e" sont des « racines n-ièmes » du 
nombre 1 : on dit souvent « racines n-ièmes de l’unité ». Ceci 
nous donne n nombres différents, pour 0 < k < n- 1 (ensuite 
pour k = n on obtient le même nombre que pour k = 0, etc). 
On peut montrer qu'il n’y en a pas d’autres, et nous venons de 
donner la description des n racines n-ièmes de l'unité. (Une dé- 
monstration de ceci, ainsi que bien d’autres informations, sera 
donnée avec le corollaire B.15). 


Si maintenant z est un complexe quelconque non- nul, écri- 


vons z = pe!8. Nous connaissons le nombre pi = = en n(o), qui 


1\# 1 ið 
vérifie (e=) = p. Si on pose alors w = pre» , on a donc w" =z : 


tout nombre complexe possède une racine n-ième. 

Par ailleurs, les n nombres wy = e aE y pour 0 < k < n-1 vé- 
rifient tous w} = z, et on montre qu'il n’y en a pas d’autres. En 
d’autres termes, tout nombre complexe non-nul possède exac- 
tement n racines n-ièmes, données par la recette ci-dessus. 


ExEMPLE A.5 — Prenons un exemple archi-simple : quelles 
sont les racines 4-èmes de 1 +i? Nous allons avoir besoin 
des racines 4-ièmes de l’unité, qui sont 


e 4 =1,i,-l1,-i pour k=0,1,2,3. 


Ensuite on calcule le Brr de z = 1 + i, qui vaut |z| = 


À = - 3⁄2 q 2; 
V2. Le nombre É = + Fi S i doit pouvoir se 
mettre sous la forme e'?. Il n'y a pas vraiment de meilleure 
méthode que de reconnaître que O = % convient. Finale- 


ment z = V2e+, et une jacine 4-ième possible est (en gar- 


dant en tête que V2 = 23) le nombre w = 25e. 
Au total, les 4 racines 4-ièmes sont w, iw, _w et -iw. 


LA NOTATION « SIGMA » 
EE ===. =] 


Sous peu nous allons avoir besoin de la notation concise 
pour les sommes, à l'aide du symbole X. Rappelons le fonc- 
tionnement. 

Supposons donnés des nombres 49,41,42,... Lorsque n > m 
on écrit 

n 


) ak pour Aam + Am+1 + Am+2 ++ 77 
k=m 


Il est essentiel de comprendre que la lettre k n’a aucune impor- 
tance et aurait pu être remplacée par n'importe quelle autre : 
c'est-à-dire que 


n n n 
k=m i=m j=m 


On dit que i, j et k sont des variables muettes. 

On utilise souvent des « changements de variables », sous la 
forme du petit raisonnement suivant (c’est juste un exemple !) : 
si k varie de m à n, posons i= k+1, alors i varie de m+1 à n+1, 
et ap = 4;j_1, d'où 

n+l 


Jus jan 


i=m+l 


Puisque les variables sont muettes, on peut donc écrire 


n+1 
Du) nr 
=m k=m+1 


Si cette dernière formule vous parait moins naturelle que la 
précédente (avec des i), alors ne l'employez pas, mais il faut 
être prêt à comprendre ces égalités lorsque quelqu'un d'autre 
les utilise. 


UN PEU DE COMBINATOIRE 


Soit X un ensemble comprenant n éléments. Combien y-a-t- 
il de sous-ensembles de X ayant k éléments ? Notons ce nombre 


n 
l: 
pour l'instant (en anticipant sur le fait que la réponse ne dé- 
pend que de n et k et non pas de X, ce qui va être établi tout 
de suite). Un petit raisonnement va nous donner une formule 
simple. 

Soit en effet m le nombre de façons de sélectionner k élé- 
ments (distincts) dans X et de les numéroter : x1, X2, ..., Xk. 
Nous allons déterminer m de deux manières différentes. D'un 
côté, on peut choisir quel élément va être pris pour x4, et nous 
avons n choix dans X; puis pour x il nous reste n — 1 choix, 
puisque x; est déjà pris; pour x3 on a n - 2 possibilités puis- 
qu'on ne peut plus prendre ni x; ni x2, et ainsi de suite. Ainsi 


m=n(n-1)(n-2).--(n-k+1). 


(Pour vous convaincre du n-k+1, essayez k = 2 : ona n(n-1) 
choix, etn- 1 =n-2+1.) 

D’autre part, pour choisir les éléments, on peut d’abord 
choisir un sous-ensemble de X comprenant k éléments, et il 
y a (7) façons de le faire ; et ensuite il faut numéroter les élé- 
ments (choisir lequel on appelle x4, lequel est x), etc). En rai- 
sonnant un peu de la même façon que ci-dessus, on voit qu’il y 
a k(k-1)(k-2)---x2x1 façons de faire cette numérotation. Au 
total 


m =(P] Hk=1)(k=2)==>x 21. 


On a bien une formule pour (}), en comparant. On va utiliser 
la notation factorielle : 


n!=n(n-1)(n-2).--x3x2x1. 


(Prononcé « factorielle n ».) Nous avons donc 


` 


d’où 
n\ _ n! 
k] ` kl(n =k)! ` 


À partir de la formule explicite, vous pouvez démontrer im- 
médiatement toutes les identités célèbres, comme 


le) (la) 
DAH) à 


Ceci dit, vous êtes encouragés à démontrer ces égalités en rai- 
sonnant sur les sous-ensembles de X, c'est un excellent exer- 
cice. 

À l’aide de (*), on peut calculer très facilement les nombres 
ci-dessus. On va construire un tableau, qui contient dans la n- 
ième ligne et dans la k-ième colonne le nombre (}). Il va être 
commode d'adopter la convention que (Ï) = 0 si k > n ou si k < 
0, et on vérifie que (*) est vraie pour toutes les valeurs de k ; par 
ailleurs, on convient de ne pas écrire les zéros dans le tableau 
(on laisse un blanc). Les premières lignes sont donc : 


pri jà j fd 


1 
2 1 

3 3 1 

C'est le triangle de Pascal qui apparaît peu à peu. Pour écrire la 
ligne suivante, on utilise (*) comme ceci : 


(Chaque nombre est donc la somme de celui immédiatement 
au-dessus et de celui à gauche au-dessus ; vérifiez que la ligne 
suivante est 1,4,6,4,1). Le calcul est très rapide, et il suffit de 
se rappeler que la toute première ligne (pour n = 0) contient 
juste un 1 (pour k = 0). On gagne cependant un peu de temps 
à mémoriser quelques lignes. 

L'utilisation la plus fameuse des nombres (}) est la formule 
du binôme de Newton, qui affirme 


(a+ b)" =) ` RES 


k=0 


(Ici a et b sont des nombres réels ou complexes, ou en fait n’im- 
porte quels éléments avec lesquels les règles de calcul usuelles 
s'appliquent.) Par exemple on a 


(a+ b)* = at + 4a°b + 6a?b? + 4ab° + bt, 


d’après le triangle de Pascal. Précisons qu’un terme de la forme 
ak b" est appelé un binôme (car il fait intervenir deux éléments 
différents), et que la formule de Newton vaut aux nombres (}) 
le nom de coefficients binomiaux. 

Donnons une idée de démonstration, pour commencer. On 
fait quelques développements « sans permuter a et b » : 


(a+b)? = (a+ b)(a+ b) = a? + ab + ba + b’. 
Puis 


(a+b)? = (a? +ab + ba+ b? )(a+ b) 


= a +aba + ba? + b?a + a?b + ab? + bab + bi. 


Ensuite on regroupe les termes, puisque aba, a?b et ba? sont 
égaux, par exemple. On trouve a°? +3a?b+ 3ab? + b’, puisqu'il y 
avait trois termes donnant a?b, un seul donnant a°, etc. 

Cette petite analyse nous fait réaliser qu’un terme de (a+ 
b)", après développement mais avant de faire permuter a et b et 
de regrouper, est de la forme x1x:-:--x, avec chaque x; € {a,b}; 
et par ailleurs, chaque écriture x1x2:--x, se retrouve une fois et 
une seule. 

Quand on veut regrouper les termes, il faut compter com- 
bien de fois on trouve a*b"-t, pour chaque k. Facile : pour 
obtenir a*b"-k à partir de x1x2::-x,, il s’agit de choisir quels 
indices i1,... ig vérifient x; = xj, => = Xj, = a, et pour les 
autres indices x; = b. Il faut donc choisir un sous-ensemble 
de k éléments parmi l’ensemble {1,...,n} de tous les indices, 


donc il y a (Ï) façons de le faire. Finalement, on obtient un 
kpn-k 
a“ b 


terme (}) , pour chaque k, comme on voulait le montrer. 
Cette démonstration est presque rigoureuse, mais certains 
la trouveront un peu vague tout de même. Pour rédiger un 
argument inattaquable (mais qui explique moins bien la for- 
mule), on va faire une récurrence, après quelques rappels. 


LE PRINCIPE DE RÉCURRENCE 
PR 0 E= E ETE 


Le principe de récurrence s'applique lorsque l'on est en pré- 
sence d'une propriété P(n), dépendant d'un nombre entier n, 
qui vérifie 

1. que P(0) est vraie (c'est l'initialisation), 

2. que pour tout n, si P(n) est vraie alors P(n + 1) est égale- 

ment vraie. 


Dans ce cas pour n'importe quel entier n la propriété P(n) est 
vraie. 

C'est une technique de démonstration très courante, nous 
allons l'appliquer pour établir la formule du binôme de New- 
ton, selon laquelle 


(a+b)" =) ` REC 


k=0 


pour tout entier n. Ici la propriété P(n) est « la formule pour (a+ 
b)" est vraie pour n ». On vérifie sans peine P(0) qui affirme 
que (a+ b)? = 1, et aussi P(1) qui affirme que (a+ b)! = a+b, 
et ci-dessus nous avons vérifié P(2) et P(3). L'initialisation est 
donc largement faite (P(0) seule aurait suffi). 

Supposons donc que P(n) est vraie et penchons nous sur la 
propriété P(n +1). On écrit 


(a+ b)"*! = (a+ b)" (a+b) 
[5 a G 
El) 


Ici on a utilisé P(n) pour développer (a+ b)”. Le reste n'est que 
calcul, l'étape essentielle étant l'utilisation de la formule (*) 
pour les coefficients binomiaux : 


(a+ bye RE 7 Wu + 2. gk n+l-k 
k=0 


k=0 
n+1 
=F. H) kput1-k, ` Ta gk pn+t1-k 
k-1 k 
k=0 k=0 
n+1 ñ zA 
_ kin+1-k 
Naa 
k=0 
n+1 
=> ` + [auh 
k 
k=0 


(Notez comment, pour obtenir la deuxième égalité, nous 
avons remplacé k par k—1 dans la somme de gauche ; la somme 
est inchangée si l'on fait maintenant varier k de 1 à n+1 au 
lieu de 0 à n, mais nous avons même laissé k démarrer à 0 
car (”) = 0.) On a bien obtenu P(n + 1) en supposant P(n), et 
par le principe de récurrence, on sait maintenant que P(n) est 
vraie pour tout n. 

Pourquoi le principe de récurrence est-il valide, au fait ? On 
peut répondre que c'est évident ; c’est une excellente réponse. 
Mais on peut avoir le désir de montrer que le principe de ré- 
currence se déduit d’un principe encore plus évident (sachant 
qu'on pourrait continuer sans cesse dans cette direction, voir 
la fin du chapitre « Ensembles »). Voici par exemple une pro- 
priété particulièrement claire : en écrivant N pour l’ensemble 
des entiers > 0, alors toute partie A C N possède un plus petit 
élément, si elle est non-vide. 

Si cette propriété de N vous paraît indiscutable, alors il doit 
en être de même pour le principe de récurrence. En effet, soit A 
l’ensemble des entiers n tels que P(n) n’est pas vérifiée. Mon- 
trons que, si P(0) est vraie, et si P(n) entraîne P(n + 1), alors A 
est vide. S'il n’en était pas ainsi, la partie A aurait un plus petit 
élément ng; on a no + 0 car P(n) n’est pas vraie ; donc ng -1 est 
un entier > 0, et n9-1 € A par minimalité de nọ, donc P(ng-1) 
est vraie, par définition. On constate que P(n,5-1) est vraie mais 
pas P(ñno), une contradiction qui montre que A = Q, autrement 
dit P(n) est vraie pour tout n € N. 


QUELQUES FORMULES 


Soit S, = 1+2+---+1n. Il est indispensable de savoir que S„ = 


n(n+1 2 ` . A 
ee On peut montrer ça par récurrence très facilement, mais 


il est bien plus joli de remarquer directement que 


S +S, = (1+ 2 +e+ n) 
+ (n+ n-1 ++ 1), 


et l'on voit bien que 2S„ est la somme de n paquets totali- 
sant à chaque fois n +1 (qui vaut aussi 2 + (1-1) = 3 + (n - 2) 
etc). On dit parfois que S„ est la « somme d'une série en pro- 
gression arithmétique ». À titre d'exercice, trouvez une formule 
pour (a+b)+(a+2b)+:..+{(a+ nb), quels que soient a et b. 
Dans la même veine, vous devez savoir que si T„ =1+r+ 


r2+...+r", alors 


1 =„qn+l 
Ir 


lorsque r + 1. On parle de la « somme d’une série en progres- 
sion géométrique ». Pour le montrer, écrire simplement 


Tr 


nt n+1 


T„(1-r)=(1+1+:+++1")-(r+12+<..r =1-r 


n+1 


On peut utiliser cette formule pour factoriser a"+! —b"+1, pour 


tous nombres a,b avec a + 0. En effet 
ati Z pti = gq =  n+l) 


avec r = b, On en tire 


at _ pti 2 al _ r)(1 pretent r") 


=(a-b)(a"+a"!b+a"?2b?4...ab"1 +b"). 


Annexe B 


L’'exponentielle 


C'est dans cet appendice que nous allons définitivement 
combler toutes les lacunes qui peuvent subsister dans vos 
connaissances du lycée. Nous parlons notamment de lacunes 
logiques, qui ne sont pas de votre fait : par exemple, au lycée 
comme dans l’appendice A on donne une définition du cosinus 
et du sinus basée sur la notion intuitive d'angle. Mais jamais 
on ne définit ce qu'est un angle! Vous allez voir que la façon 
rigoureuse de s’en sortir est de définir les fonctions trigono- 
métriques d’abord et les angles après. (C’est donc logiquement 
différent.) 

Voici le programme. On va définir pour tout complexe z € C 
un autre nombre e” € C, à partir « de rien » (mais en faisant ap- 
pel à la notion de convergence absolue tout de même, ce qui 
explique que ce n’est pas faisable au lycée). Ensuite on montre 
que pour x € R, le nombre e* est bien celui auquel on pense 
en terminale ; notre première victoire est donc une vraie défi- 
nition de la fonction exponentielle usuelle. 

Ensuite on définit cos(@) et sin(@) comme étant les par- 
ties réelles et imaginaires de e’? lorsque O € R , de sorte que 
l'égalité e/° = cos(0) + isin(0) est vraie par définition. On dé- 
montre alors (et c’est difficile) que tout point A sur le cercle 
de centre (0,0) et de rayon 1 est de la forme e° pour un 
nombre 6 € R défini à un multiple de 27 près - mais sur- 
prise, vous verrez que nous définirons le nombre m au passage 
(comme étant le plus petit réel tel que cos(3) = 0, en gros). 

Cette étude étant faite, on peut alors dire que 8 est « une 


mesure de l'angle entre OA et l'horizontale », ce qui définit 
presque le mot angle. Nous disons « presque » parce que c’est 
seulement la « mesure de l’angle » qui est définie : il n’y a pas 
du tout de définition mathématique de l'angle lui-même, fina- 
lement (on peut se forcer à en donner une, mais d’une manière 
ou d’une autre on se ramène toujours à la mesure). 

Le présent appendice contient également une démonstra- 
tion du « théorème fondamental de l'algèbre », et quelques ré- 
sultats sur l’exponentielle de matrice. 


L’EXPONENTIELLE COMPLEXE 


DÉFINITION B.1 — Soit z € C. On note exp(z) ou e7 le nombre 


Le nombre complexe e? est appelé l’exponentielle de z. 
L'existence de la limite a été montrée dans l'exemple 3.26. 
La plus importante propriété de l’exponentielle est sans 


conteste la suivante : 


THÉORÈME B.2 - Soient a et b deux nombres complexes. Alors 


En particulier, pour tout nombre complexe z, on peut cal- 
culer e7e™ = e? = 1. On constate donc que e” + 0. 


Démonstration. On a e“*? = lim Un, en posant 


n 
S (a+ b)* 
m=) E> 
=0 


En utilisant la formule de Newton pour le binôme, on peut dé- 
velopper et obtenir : 


Il 
M= 

|R 
=| S 
VAS 
Flo 
UIT 
S| 
`= 


. . P . 
Si maintenant on pose apq = aT et s1 on note 


a 
p 
T„ =((p q) ENxN|0<p+q<nj, 
alors le calcul précédent s'écrit 
de. 
(p.q)ETn 


De même, on a e'e? = lim v„ où 


On peut développer le produit : 


n n aP ba 
Va = > E p! q! . 
p=0 q=0 


Si on pose cette fois-ci 


Cu =(((p.q)ENxN|0<p<net 0<q<n)j, 


m= Y app 


(p.9)ECn 


alors on a 


On souhaite montrer que (u,) et (v„) ont la même limite, ou 
encore que v, — u„ —— 0. Cette différence s'écrit 
n= 


Vn — Un = Y Up. 
On a donc la majoration 


[vn - unl < D lap, ql> 


(p.9)ECn ST 


lal” |b]9 
pl q” 
démontré le théorème pour |a| et |b] à la place de a et b, alors 


on saurait que le membre de droite de cette dernière inégalité 
tend vers 0, donc le membre de gauche aussi. Ainsi, il est suf- 
fisant de montrer le théorème pour tous les nombres réels > 0, 
l'argument ci-dessus montre qu'il est alors vrai pour tous les 
complexes. 

Nous poursuivons donc en supposant que a > 0 et b > 0. Il 
suffit alors d'observer que C„ C Tr, C Czn pour en déduire que 


et |@p,al = On en tire la conclusion suivante : si on avait 


Vha < Un < Vn. 


Ces trois suites sont convergentes, il est donc clair qu’elles ont 
la même limite. 


Le résultat suivant va être utile pour calculer des dérivées. 


Proposirion B.3 — Pour tout nombre complexe zo, on a 
E =en 


lim e. 
dE AY E= 


C'est bien une limite dans les complexes, pas seulement 
dans R. Donc à strictement parler ce n'est pas un nombre 
dérivé. 

Démonstration. Prenons d'abord zo = 0. On écrit 
-1 z z? F z" ` 
+ +. 
Z 2! 3! (n+ 1)! 


=1+ JS P + - + 
421 7 31 (n +2)! | 


Lorsque |z| < 1, on a la majoration 


L + Z + < |z| 
(217 3! (n + 2)! > 


On a donc bien Z => 1 = e? lorsque z > 0. 
Maintenant si Zo est quelconque, on pose h =z-2z, et d’après 
le théorème précédent, 


eZ — e70 ezoth — e70 e! = | 
—  — e0 — e” 2 
Z— Zo h 


en utilisant le cas particulier déjà traité. 


On dit parfois 
que la fonction 
z H> e? est 


« holomorphe ». 


L'EXPONENTIELLE RÉELLE 
RE 


Lorsque x € R, il est clair que e* € R. Nous allons nous tour- 
ner vers l'étude de x + e*, vue comme une fonction R — R, et 
bien sûr l’un de nos objectifs est de vérifier qu’il s’agit bien de 
la fonction abordée en terminale. 

Voici de quoi s’en convaincre : 


Lemme B.4 - La fonction exp : R => R est dérivable, et exp’ = 
exp. De plus, il s'agit de l'unique fonction ayant cette propriété et 
prenant la valeur 1 en 0. 


Le mot-clef est peut-être « unique » : au lycée on vous a cer- 
tainement présenté l’exponentielle comme une fonction égale 
à sa dérivée, et telle que exp(0) = 1, sans pouvoir démontrer son 
existence. D'après le lemme, la fonction exponentielle que nous 
avons présentée est la bonne. 


Démonstration. Le fait que exp’ = exp découle directement de 
la proposition B.3. 

Soit maintenant une fonction f: R => R telle que f’ = f 
et f(0) = 1. On considère la fonction g définie par g(x) = 
e *f(x). On a alors g'(x) = -e *f(x) +e *f'(x) = 0 puisque 
f'(x) = f(x). Par suite, la fonction g est constante, disons g(x) = 
c. 

Mais alors f(x) = e*g(x) puisque e*e-* = e? = 1, donc f(x) = 
ce*. Si nous prenons en compte f (0) = 1, on en déduit c = 1, et 
finalement f (x) = e*. 


Proposition B.5 — La fonction exponentielle réalise une bijec- 
tion R => R”. Sa réciproque, que l'on appelle le logarithme né- 
périen et que l'on note In: R>? => R, est dérivable. De plus, on a 
In'(x) = À. 


Démonstration. On a vu que l’exponentielle ne s’annulait pas. 
D'après le théorème des valeurs intermédiaires, elle ne peut 
pas changer de signe sur R, et comme e? = 1, on conclut que 
e* >0pour x E R. 

Comme exp’ = exp > 0, l'exponentielle est croissante. On a 
donc e* > 1 pour x > 0. En considérant g(x) = e*-x-—1, qui 
satisfait g(0) = 0 et g'(x) =e*-1 > 0 pour x > 0, on s'aper- 
çoit que g est croissante et donc reste positive pour x > 0. En 
d'autres termes e* > x+ 1 pour x > 0, et en particulier 


lim e* =+0œ. 
X—>+00 


On en déduit 


lim e*= lime *= lim —=0. 
X——00 X—+00 x—+00 e* 

D'après le théorème des valeurs intermédiaires, l’image 
de R par la fonction exponentielle est un intervalle, contenu 
dans ]0,+co[. Vues les limites que nous venons de calculer, cette 
image doit être ]0,+co[ tout entier. 

On a donc montré que l’exponentielle était une bijection 
comme annoncé. Les assertions sur la réciproque se montrent 
avec la proposition 6.20, et à vrai dire, nous l’avons déjà fait 
dans l'exemple 6.22. 


Voici une dernière propriété qui était familière au lycée. 


ProposiTION B.6 — Soit N un entier. Alors 


X—+00 X 
et 
lim xNe*=0 
X—>—00 
Enfin 


e 7 2 n 
Démonstration. Posons P„(x) =1+x+ # +... + Š, de sorte 
n 2 n! 


+ . 
que e* = lim, P,(x). Pour x > 0, on a e* > P„(x) pour tout n; 
or pour n > N on a déjà 


lim En) = +00, 


X—+0 x 


pour des raisons de degrés. La deuxième limite se calcule 
en prenant l'inverse, puisque e™ = = Pour la troisième, on 
pose x = x(t) = In(t), de sorte que tln(t) = xe* avec x(t) — -co 


lorsque t > 0, d’où le résultat. 


LE CERCLE ET LE NOMBRE T 
mű 


Nous allons maintenant étudier la fonction y définie sur R 
par y(t) = e". En identifiant C et R?, on pense à y comme à une 
courbe dans le plan. Commençons par une remarque. 


LEMME B.7 - Soit z € C. Alors æ = æ. 
Démonstration. Il faut noter que si (u,) est une suite de com- 
plexes telle que u, = a,+ib, > £ = l1 + ilz, alors u, = a,-ib, > 


=t, -ib (puisque a, — €, et b, > 42). 
On obtient le lemme en appliquant cette remarque à 


n 
z" 
Un = ) PE 
n: 

k=0 


qui converge vers e”, alors que 


converge vers ef. 


Puisque it =-it quand t € R, nous avons eï =e" '*, et donc 


Par suite |y(t)|= 1 : la courbe y prend ses valeurs dans 
C = (z € C tels que |z| = 1}, 


c'est-à-dire le cercle de centre (0,0) et de rayon 1. L'un de nos 
grands objectifs est de montrer que y passe par chaque point 
du cercle C. 


Lemme B.8 — La fonction y est dérivable et y'(t) = ie". 


Démonstration. On calcule 
eit _ eito eit _ eito 
= 
t— to 1t— 110 


d’après la proposition B.3 appliquée en zÔ = itọ. 


On a notamment |y/(f)| = |ie| = 1. En termes plus géo- 
métriques : le point y(t) se déplace à vitesse constante le long 
du cercle. Intuitivement, c'est peut-être déjà suffisant pour se 
convaincre que y va faire tout le tour de C. 


DériniTIoN B.9 - On définit une fonction cos sur R par la for- 
mule 


On l'appelle le cosinus. De même on définit une fonction sin 
sur R par la formule 


sin(t) = Im(e") = 
et on l'appelle le sinus. 
On a donc e” = cos(t) + isin(t). De plus la relation Je? = 1 
donne cos(f)? + sin(t)? = 1. 
À partir des définitions et du lemme précédent, on obtient 
tout de suite : 


Lemme B.10 — La fonction cos est dérivable et cos’ = -sin. De 
même la fonction sin est dérivable et sin’ = cos. 


Voici un résultat fondamental. 


THÉORÈME B.11 — Il existe un unique nombre réel positif, noté T, 
tel que 
del = feIpxevec net, 


De plus, on a e't +1 = 0. 


Démonstration. Commençons par une petite étude du sinus au 
voisinage de 0. Puisque e°? = 1, on a sin(0) = 0 et sin'(0) = 
cos(0) = 1. Comme la fonction cosinus est continue (et même 
dérivable), la proposition 4.19 nous assure qu'il existe un in- 
tervalle ]a,b[ avec a < 0 < b tel que cos(t) > 0 pour t €]a,bl. 
La fonction sinus est donc strictement croissante sur cet inter- 
valle, et en particulier sin(t) + O si t # 0 et t €]a, b[ ; on en déduit 
également que e'f + 1 pour t # 0 et t e]a, b|. 

Montrons maintenant que la fonction cosinus peut s'annu- 
ler. Procédons par l'absurde : si cos(t) +» O pour tout t, alors 
on aurait cos(t) > 0 d'après le théorème des valeurs intermé- 
diaires, et sin serait croissante sur tout R. En particulier, on au- 
rait sin(t) > sin(b) > 0 pour t > b. Mais alors, regardons la fonc- 
tion g définie par g(t) = cos(t) + sin(b) t - 1 qui vérifie g(0) = 0 
et g’(t) = —-sin(f) + sin(b) < 0. Elle est donc décroissante, et par 
suite g(t) < 0 pour t > 0, ce qui donne cos(t) < 1 -sin(b) t. C'est 
absurde, puisqu'on en déduit que cos(t) — —-c lorsque t > +œ, 
alors que bien sür le cosinus prend ses valeurs dans [-1,1] à 
cause de la relation cos(t)? + sin(t)? =1. 

On peut donc trouver tọ tel que cos(fo) = 0, et on peut même 
s'arranger pour que tọ > 0. On a alors sin(fp)? = 1 donc sin(to) = 
+1 et e" = +i. Comme i4 =(-i)*=1, on a e#!f0 =(etto)4 = 1, 

Passons au théorème proprement dit. Posons 


K=([teR]e* =1), 


et 
A=[teKett>0]. 


Nous avons prouvé que A + 0, puisque cet ensemble contient 
l'élément 4f, > 0. Nous avons également prouvé que A ne 
contient aucun élément dans l'intervalle ]a,b[. On peut donc 
poser € = inf A, ce nombre est alors bien défini et € > b > 0. 
Enfin, on pose x = £ (c'est la définition du nombre m). 

Il faut commencer par vérifier que 27 = € appartient à K 
(et même à A). En effet, par définition de l’inf il existe une 
suite (f,) qui converge vers € avec f, € A, donc eitn = Yt) =1; 
Par continuité de y, on a y(f,) > y(£), et donc y(£) = 1, ce qui 
signifie bien que € E K. 

Soit maintenant t € K quelconque, et soit n l'unique nombre 
entier tel que 


t 
n < Sas =^ < n+ 1, 
2T 
de sorte que 0 < t - 217 < 27. On note que 


i (t-2nT) 2 git  2niT _ e Co =-1x1"=1. 
Ainsi t - 2nT € K, mais par définition de 2x = £ = inf A, le seul 
élément de K dans [0, 27[ est 0. On en conclut bien que t = 2nT, 
comme on souhaitait le montrer. 

Enfin, le nombre e'™ vérifie (e!7t)? = e”™ =1, donc e'™ = +1. 
Mais n < 27 donc e!" = 1 est exclu. Finalement on a bien e!” = 
—1, ce qui achève la démonstration. 


Proposition B.12 — Sur l'intervalle [0, 3], la fonction cosinus est 
décroissante. Son image est l'intervalle [0,1] entier. 

Sur le même intervalle, la fonction sinus est croissante. Son 
image est également l'intervalle [0,1] entier. 

Démonstration. Le nombre x = e/? vérifie x? = ei = -1, donc 
x = +i. On a donc cos($) = 0 et sin(F) = +1. (Dans un instant 
nous allons trouver le bon signe.) 

Le nombre 3 est le plus petit nombre réel positif pour le- 
quel le cosinus s’annule : en effet si tọ est un tel nombre, nous 
avons vu au cours de la démonstration du théorème que 4tọ vé- 
rifie e#/*0 = 1 ; nous savons alors que 4tọ est un multiple de 2%, 
donc tọ est un multiple de 3. Ainsi la fonction cosinus ne s’an- 
nule pas sur [0, 5[, et donc elle ne change pas de signe (valeurs 
intermédiaires). Comme cos(0) = 1, on en déduit cos(f) > 0 sur 
cet intervalle. 

La fonction sinus est donc croissante sur le même intervalle 
puisque sin’ = cos, et puisque sin(0) = 0,onasin(t) > 0 pour t € 
[0,5]. En particulier sin(F) = +1. 

Enfin, la relation cos’ = -sin montre que la fonction cosinus 
est décroissante, toujours sur le même intervalle. 

Pour conclure, c’est le théorème des valeurs intermédiaires 
qui garantit que les deux fonctions en question prennent bien 
toutes les valeurs entre 0 et 1. 


us 
2 


Nous avons atteint notre objectif : 


Proposition B.13 — Tout point du cercle unité C est de la forme e't 
pour au moins un nombre t € R. De plus, deux nombres t et u 
vérifient e't! = e™ si et seulement si t = u + 2nm avec n E Z. 
Démonstration. Si et = ei, alors e”) = 1, donc la dernière 
partie de l'énoncé est une conséquence du théorème. 

Soit maintenent x + iy un nombre complexe de module 1, 
c'est-à-dire que x? + y? = 1. Dans un premier temps, suppo- 
sons que x > 0 et y > 0, de sorte que y = V1- x?. Le nombre x 
appartient à [0,1], il est donc de la forme x = cos(t) pour un 
unique nombre t € [0, 7], d'après la proposition précédente. On 
a alors sin(t) > 0 et bien sûr cos(t)? + sin(t)? = 1, donc sin(t) = 


V1=cos(t)2 = V1 - x? = y. Finalement ef! = x+iy, ce qui prouve 
le résultat dans ce cas. 

Si y < 0, on prend d’abord un t tel que el! = x— iy (cas pré- 
cédent), et alors e`" = x + iy (lemme B.7). Et enfin, si x < 0, on 
prend t tel que e = -x — iy, et alors e+’) = —eit = x + iy. 


exercice : donnez 
une 
démonstration 
de toutes les 
propriétés des 
fonctions sinus 
et cosinus que 
vous connaissez 


depuis quelques 


FORME POLAIRE ET RACINES H-IÈMES 
EE —_————.—_—_—_—_—_—_—_—_—_—_—— =c mi 


Proposition B.14 - Tout nombre complexe non-nul z € C* peut 
s'écrire z = pe'® avec p > O et O € R. Le nombre p est unique, et en 
fait p = |z|; le nombre © est déterminé à un multiple de 27 près. 

En conséquence, tout nombre complexe non-nul z peut s'écrire 
z =e" pour w e C. 


Démonstration. Il suffit de considérer Éi : Cest un complexe de 
module 1, donc 5 = ei? d'après la proposition B.13. Ainsi z = 
|z|e#9. La même proposition indique que 6 est déterminé à un 
multiple de 27 près. 


En prenant x = ln(|z|), et w = x + i0, nous avons bien e” = 
eed? = zlet? = z. 


Voici une application importante : 


COROLLAIRE B.15 — Soit n > 1 un entier. Tout nombre complexe z 
possède des racines n-ièmes. 

Plus précisément, si z + 0, il existe exactement n nombres (dis- 
tincts) œg, Qj, ..., Xn -1 tels que ağ =z. 


La démonstration va indiquer comment trouver explicite- 
ment ces racines. 


Démonstration. On écrit z = pei8 et l'on prend œ = ypeir ;ona 
alors effectivement a” = pe! = z. 

Voyons les autres possibilités. Si BP = ref? vérifie B” = 1 = 
r''e"i®, alors on doit avoir r” = p et np = O + 2k avec k E Z. 
Comme r > 0, on en déduit r = ï/p. D'autre part 


6 2kn 
b= >+, 

n n 

donc : 
à :0 2kim 

eV = pï e n 


. 2kim . je 
de sorte que finalement $ = ae" pour un certain k € Z. Réci- 
proquement si P est de cette forme alors PB” = a” = z, puisque 


2kin \” 
e n = ] 
2kin 2in 


Si k et € sont deux entiers, alors les nombres e # ete =« 
sont égaux précisément lorsqu'il existe un entier m tel que € = 
k + mn (autrement dit, lorsque k et £ sont égaux modulo n). 


2ki 
On en déduit que pour 0 < k < n-1, les nombres en sont 


distincts, et que tout nombre de la forme e » avec £ entier est 
dans cette liste. Ce sont les n racines « de l'unité ». 
Finalement on a bien n nombres qui conviennent, à sa- 


á 2kim 
voir ap=œe n pour0<k<n-1. 


voir les exercices 
42, 43, 44, 45, 
2939 


Quel lien 
voyez-vous entre 
les racines 
n-ièmes 


et Z/nZ ? 


LE THÉORÈME FONDAMENTAL DE L'ALGÈBRE 
[5e 


Ce théorème est cité dans le premier chapitre d’algèbre 
(sous le numéro 11.9) sans démonstration. Revoici l’énoncé : 


THÉORÈME B.16 — Tout polynôme de degré > 1 dans C[X] possède 
une racine dans C. 


Démonstration. Soit donc P € C[X] de degré > 1 ; écrivons 
P(X)=ap+aX+aX2+...+a,X", 


avec 4, # O. 
La fonction définie sur C par z H> P(z) est continue. De plus 
en écrivant 


Ay-1 1 4y2 1 ag 1 
P(z) = az” (1 + A = + 2 = 4...4 © 


, 
An Z Ap 2? An Z" 


on voit que pour toute suite (z,),>0 de nombres complexes 
tels que |z„] > +0, on a également [P(z,)| > +0. La fonc- 
tion f: R? => R définie par f(z) = [P(z)| satisfait donc les hy- 
pothèses de la proposition 5.8, et on conclut qu'il existe zg € C 
tel que f(z) > f(z0) pour tout z € C. Nous allons montrer 
que f (zO) = 0, donc P(z5) = 0, ce qui établit le théorème. 

Procédons par l'absurde, et supposons que P(z5) + 0. Pour 
se faciliter les choses, considérons 


Q m P(zo + X) f 
P(zo) 
alors Q est un polynòme de même degré que P, la quan- 
tité [Q(z)| atteint un minimum en 0, et ce minimum vaut Q(0) = 
1. Écrivons 


Q(z) = 1+ baz? + bg, 2941 +--+ buz", 


avec b4 # 0, et d > 1. Maintenant, pour se débarrasser de bg, 
passons au polynôme 


R(X) = Q(aX), 
où a vérifie af = -$ : un tel nombre existe d’après le corol- 
laire B.15. Ce R est un polynôme de degré n, la quantité [R(z)| 
atteint un minimum en 0, et ce minimum vaut encore R(0)=1; 
mais de plus 


d+1 PR D 


R(z) = 1- z" + Cd+1Z 
pour des coefficients c; dont la valeur n’a pas d'importance 
pour la suite. 

Montrons que la relation [R(z)| > 1 nous mène à une contra- 
diction. Prenons x € R et x > 0, et écrivons R(x) = 1-x%+xe(x), 
avec e(x) > O lorsque x > 0. Avec l'inégalité triangulaire il 
vient 


1 <|1=x%|+|x*e(x)] 
=1-x4+ xd le(x)|. 
Pour x suffisamment petit on aura |e(x)| < 1⁄2, et en arrangeant 


les termes de l'inégalité ci-dessus on aura 2 < 1, une contradic- 
tion. 


- Fin de la première lecture - 


MATRICES ET NORMES 


DÉFINITION B.17 — Soit A = (aij) € Mu mÒ (R). Sa norme (eucli- 


dienne) est 
Al =| Y` a? 
i,j 


De même, soit A = (a;j) E M„ Ô (C). Sa norme euclidienne est 


il 
À 
WERE EEE 
Lj 


Quelques remarques s'imposent. Une matrice réelle dont la 
taille est nxm est constituée de nm coefficients, et on peut iden- 
tifier l'ensemble M, m(R) avec R'*. Ceci étant fait, la norme 
d'une matrice n'est autre que la norme euclidienne du vec- 
teur correspondant de R””, que nous connaissons bien (défi- 
nition 3.28). De même avec les matrices complexes, on identi- 
fie M„ Ô (C) avec C™” ; de plus on peut identifier C avec R?, de 
telle sorte que z = x+iy correspond à (x, y), et alors |z|? = x2+72 ; 
par suite C""' peut être vu comme R?™””, et au total la norme 
d'une matrice complexe n'est rien d'autre que la norme du vec- 
teur de R?™”” correspondant. 

Pour les calculs, il va être utile de faire la remarque sui- 
vante. Si les colonnes de A sont C4, C2,..., Cm, alors 


2 2 2 
IAJE = NC + +++ +1; 
de même si les lignes de A sont L, ,..., L„, alors 
2 2 2 
IAJE = Ea N< + +++ Lall. 


La différence entre les matrices et les vecteurs, évidemment, 
est que l’on peut multiplier les matrices. Le résultat suivant 
donne le lien entre les normes et la multiplication. 


Lemme B.18 — Soient A € M,,,,(C) et Be Mm elC). Alors 


IAB]! < IIAII- [BIL 


Démonstration. Écrivons A = (aij) et notons L4,..., L„ les lignes 
de A; de même écrivons B = (b;;) et notons C4,...,Cg les co- 
lonnes de B. La matrice AB possède, sur sa ligne ií et dans la 
colonne j, le coefficient 


m 


Cij = Y aikbij: 


k=1 
On a donc les inégalités 


m 


Ieijl < Y ` la;xllbxjl 
k=1 


1 
2 2 
< ) CAA ) |bx;l 
k 


k 


1 


Z 


= [IL;ll- ICI. 


La première est l'inégalité triangulaire, la deuxième est l'inéga- 
lité de Cauchy-Schwarz (lemme 3.32). En prenant la somme, il 


vient 
2 2 
ABI? = ` lci]? < Y ILAI? NC; 
i,j i,j 


=| X ma || IC; 
i j 


= [JAI -IBI . 


Le résultat en découle. 


L’EXPONENTIELLE DE MATRICE 


Lemme B.19 — Soit À une matrice carrée. On note 


n 
1 
S,(A) = T a 3 
FED ` 


Alors la suite (S,(A)),>0 possède une limite. 


Avant de donner la démonstration, indiquons tout de suite : 


DÉFINITION B.20 — Soit À une matrice carrée, à coefficients com- 
plexes. Son exponentielle est 


+00 
1 
exp(A)= ef = lim S = > A 
EQ ` 


Démonstration. On utilise la convergence absolue, c'est-à-dire 
le théorème 3.30, qui nous assure qu'il suffit de vérifier que 


existe. Or, on a 


d'après le lemme B.18. Si on note 


n 
E) 
k=0 


, 


l ak 
TÂ 


on a donc 
n | +00 1 
MS) GA < Y AI = el. 
k=0 ` k=0 ` 


La suite (u„) est donc croissante et majorée, et on en conclut 
qu'elle possède bien une limite. 


Pour l'instant, on ne sait calculer que des exemples très 
simples : 


ExEMPLE B.21 — Prenons une matrice diagonale : 


x 0 
A= | 
| 0 y | 
On a donc 
x" 0 
ME 0 y" | 
et $ 
n x 
S„(A) Lk=0 k! ` y% | 
0 Le 


ProposirioN B.22 - L'exponentielle de matrice possède les proprié- 
tés suivantes : 


1. Si P est inversible, alors 


= = 
Au Pale. PA 


2. Si AB = BA, alors e^ B = Bet. 
3. Si AB = BA, alors 


La propriété (3) est la plus importante, bien sûr. Attention, 
l'hypothèse AB = BA est nécessaire! 


Démonstration. Pour le (1), on calcule d'abord 
(PLAP)? =P-!APP'!AP=P-!A?P, 
et de même 
(PLAP)? =P-!AP(P!AP)? =P !APP!A?P =P-!A3P. 
Par récurrence on obtient pour tout n : 
(P AP)" =P-!A"P. 


On voit que S„(P-! AP) = P-!S„(A)P, d’où la formule (1) en pas- 
sant à la limite. 

Pour le (2), on passe à la limite dans la relation évidente 
S„(A)B = BS„(A) (ou alors, si B est inversible, on utilise la rela- 
tion B-!AB = A, d’où B-!e^B = e^ d'après le (1)). 

Pour le (3), c'est essentiellement la même démonstration 
que pour le théorème B.2. L'hypothèse AB = BA est utili- 
sée pour pouvoir utiliser la formule de Newton qui donne le 
développement de (A + B)” (elle est fausse si AB + BA, par 
exemple (A + B)? = A? + AB + BA + B? en général). On constate 
(toujours en suivant les étapes de la démonstration dans le 
cas des complexes) qu'il suffit de montrer la formule pour |[A| 
et ||B]| au lieu de A et B, et nous savons que l'identité est vraie 
pour les nombres réels. 


ExEMPLE B.23 - Prenons 


11 18 
a=| -6 -10 | 


Pour calculer e^, on essaie de la mettre sous la forme P-!BP 
où B est le plus simple possible. Dans le chapitre « Diago- 
nalisation », nous verrons de nombreuses techniques pour 
faire ça; pour l'instant, admettons que l’on nous ait soufflé 


que, en posant 
-3 -2 


Par =| 1.9 )=D. 


alors 


02 


On a donc Z 
e^ = PDP! _ peP p7, 
d'après le (1) de la proposition. On peut calculer eP sans 


peine comme dans l'exemple précédent, et finalement 


#-(5 3% 2)(2 2) 


_( -=3el+4e2 -6el+6e? 
H 2e ! =2e? ` 4e !=3e2 |` 


Voici comment exploiter la propriété (3). Prenons 
5 7 
se) 
On pose alors A = D+N avec 
5 0 0 7 
o-(3 2) a nf?) 
On vérifie que DN = ND, donc e = eP eN., De nouveau, on 
peut calculer eP facilement puisque la matrice est diago- 


nale. Pour N, on constate que N? = 0, ce qui ramène son 
exponentielle à eN = Id + N. Finalement 


ëv 7e | 


e^ = eP(1d +N) = | 0 e 


voir l'exercice 
1716 


EXPONENTIELLE ET DÉRIVÉE 
ÁMM 


Proposition B.24 — Soit A une matrice complexe, de taille n x n. 
La fonction y: R => M„(C) définie par y(t) = e^ est dérivable, et 
sa dérivée est y/(t) = Ael = Ay(t). 

De plus, cette propriété caractérise y, c'est-à-dire que si c: R > 
M,(C) vérifie c’(t) = Ac(t) et c(0) = Id, alors on a c(t) = y(t) pour 
tout t. 


Il faut noter que, si s et t sont deux nombres réels, alors les 
matrices sA et tA commutent, donc el5tf)A = esAetÀ, En d’autres 
termes y(s + t) = y(s)y(t). 


Démonstration. Le calcul de y'(t) est tout à fait analogue à la 
démonstration de la proposition B.3. 

Montrons l'unicité. Supposons donc que c'(t) = Ac(t) et 
c(0) = Id, et définissons 


f(t) =e c(t). 
D'après le lemme 6.25, la dérivée de f est donnée par 
F) =(=A)e !^c(t) + ec (t) =e  [-Ac(t) +c'(t)]=0. 


On a utilisé le fait que Ae !'^ = e *^A, d'après le (2) de la propo- 
sition B.22. Puisque f'(t) = 0, on en conclut que f est constante, 
donc pour tout t on a f(t) = f (0) = Id. Ceci donne e" !^c(t) = Id, 
et en multipliant par et^ on en tire bien c(t) = e*^ = y(t). 


